NTT版LLM「tsuzumi 2」が超進化!ビジネス文書の図表も理解する賢さに!

みなさん、こんにちは!最近、AIの進化には目を見張るものがありますよね。特に「大規模言語モデル(LLM)」は、私たちの働き方や情報との向き合い方を大きく変えようとしています。そんな中、NTTから発表された軽量LLM「tsuzumi 2」が、この度、さらにすごい進化を遂げたというニュースが飛び込んできました!

今回のアップデートのポイントは、なんと言っても「図表入り日本語ビジネス文書の処理性能」が世界トップレベルにまで向上したこと。しかも、たった1つのGPU環境でこれを実現しているというから驚きです。まるで、小さくてパワフルなスーパーコンピューターが、私たちのデスクにやってきたような感覚ですね。tsuzumi 2が本来持っていた日本語処理能力の強みを活かしつつ、ビジネスシーンで頻繁に使われる図表やグラフ、チャートまでしっかり理解できるようになりました。これはもう、ビジネスパーソンにとっては朗報中の朗報と言えるでしょう!

LLMの課題を解決する「tsuzumi 2」の存在

近年、ChatGPTをはじめとするLLMが大きな注目を集めていますが、従来のLLMにはいくつかの課題がありました。例えば、膨大な学習データや計算リソースが必要で、それにかかる電力消費や運用コストが増大してしまうこと。また、機密性の高い情報を扱う際のセキュリティリスクも、多くの企業や組織にとって大きな懸念材料でした。

そんな課題に応えるべく、NTTは2025年に軽量でありながら世界トップレベルの日本語処理性能を誇る「tsuzumi 2」を発表しました。その「軽量さ」という特徴を最大限に活かし、オンプレミス環境やプライベートクラウド環境で、機微情報を扱う業務に適用されてきました。これは、外部にデータを持ち出すことなく、自社の環境内で安全にAIを活用したいというニーズにぴったり合致したからなんです。

今回のアップデートの目玉!「図表理解」のすごい進化

今回のアップデートは、特にビジネスの現場で頻繁に使用される文書に焦点を当てて開発されました。皆さんもご存じの通り、ビジネス文書には、テキストだけでなく、数字が並んだ表や、傾向を示すグラフ、意思決定を助けるフローチャートなど、たくさんの「図表」が含まれていますよね。そして、これらの図表の中には、会社の売上データや顧客情報といった、非常に重要な機微情報が含まれていることも少なくありません。

これまでのLLMは、主にテキスト情報を処理することに長けていましたが、図表の「視覚的な意味」を理解するのは得意ではありませんでした。しかし、tsuzumi 2は、文書全体を「画像」として読み込むことで、テキスト情報に加えて、図表が持つ視覚的な意味まで深く理解できるよう進化したんです!これはまさに、AIが“目”を持ったようなもの。単に文字を認識するだけでなく、図表のレイアウトや色、線の意味まで読み解き、そこに隠された情報を引き出すことができるようになりました。

例えば、こんなシーンを想像してみてください。大量の源泉徴収票から特定の金額を抽出したり、複雑な機器の障害原因切り分けフローチャートを読んで、適切な対応手順を導き出したりする作業。これまでは人間が一つ一つ確認し、判断する必要がありましたが、tsuzumi 2なら、まるで熟練の専門家のように、これらの作業を正確かつスピーディーにこなしてくれます。

源泉徴収票の金額抽出

どうですか?この画像を見てください。源泉徴収票がAIに読み込まれると、給与・賞与の支払金額、給与所得控除後の金額、所得控除額の合計額、源泉徴収税額、社会保険料等の金額まで、必要な情報が瞬時にリストアップされていますよね。これなら、経理担当者の皆さんの業務負担はぐっと軽くなること間違いなしです。

そして、もう一つの例がこちら。

機器障害原因切り分け

機器が故障した際、「赤いLEDが点滅して、E15の表示が出て音が鳴っています。何をすればいいですか?」という問いに対し、tsuzumi 2はフローチャートを読み解き、「この状態では、まずバッテリ交換を試みることが推奨されます」と的確なアドバイスを返しています。まるで、優秀なサポートデスクの担当者が隣にいるかのようですね。このように、図表から重要な情報を抜き出してデータベース化するなど、機微情報の取り扱いに関する業務を一層効率化してくれるでしょう。

さらに賢く!「論理的思考能力」もグッと強化!

今回のアップデートでは、図表理解だけでなく、実用上必要となる数値処理などの「論理的思考能力」も大幅に強化されました。これは、ビジネスの現場でAIをさらに深く活用していく上で、非常に重要なポイントとなります。

例えば、売上金額や利益率といった数値情報の理解や計算。これまでのAIでは、単に数字を認識するだけでなく、その数字が持つ意味や、他の数字との関連性を論理的に解釈することが難しかったりしました。しかし、tsuzumi 2は、より高度な数値処理能力を身につけ、複雑な財務データや経営指標も正確に分析できるようになりました。これは、経営戦略の策定や事業計画の見直しにおいて、きっと強力な味方になってくれるはずです。

また、APIドキュメントなどの技術文書に含まれる関数の解釈も、より高い水準で行えるようになっています。プログラマーやシステム開発者の皆さんにとっては、これは本当に嬉しい進化でしょう。複雑なAPIの仕様書を読み解き、適切なコードを生成したり、既存のコードの問題点を見つけ出したりといった作業が、格段にスムーズになることが期待されます。これにより、より複雑で多様な要求にも、tsuzumi 2が柔軟に応えることが可能になりました。まるで、AIが単なる情報処理マシンから、高度な思考力を持つビジネスパートナーへと進化を遂げたかのようです。

ベンチマークで見る!「世界トップレベル」の実力

NTTは、今回のアップデートによって、tsuzumi 2が同サイズ帯のモデルと比較して「世界トップレベルの性能」を実現したと発表しています。その実力は、具体的なベンチマークスコアからも明らかです。

まず、図表入りドキュメントの処理性能を見てみましょう。

tsuzumi 2 30B ベンチマーク(図表入りドキュメント等)

このグラフを見ると、tsuzumi 2 30Bは、図表入りドキュメント、図表入りスライド、グラフ・チャートのいずれの評価においても、同サイズ帯の他社モデルを大きく上回るスコアを叩き出しています。これは、tsuzumi 2が日本語のビジネス文書に特化して開発された強みが、最大限に発揮されている証拠と言えるでしょう。ビジネス現場で飛び交う様々な形式の情報を、AIが正確に理解し、活用できる未来が、もう目の前に来ているのかもしれません。

さらに、知識、解析、指示遂行、安全性といった多角的な視点から見ても、tsuzumi 2の日本語処理能力は引き続き高い水準を維持しています。

tsuzumi 2 30B ベンチマーク(知識・解析・指示遂行・安全性)

このベンチマークスコアは、tsuzumi 2が単にテキストを生成するだけでなく、質問応答や常識推論、読解、そしてユーザーの指示を正確に理解して実行する能力、さらには安全な回答を生成する能力においても、非常に高いレベルにあることを示しています。特に、ビジネス現場でAIを安全に、そして信頼して活用するためには、「安全性」の評価が高いことは非常に重要ですよね。

これからのtsuzumi 2に期待すること

今回のアップデートで、ビジネス文書における図表の理解や論理的思考能力が格段に向上した「tsuzumi 2」。NTTは、この進化を遂げたtsuzumi 2を、NTTグループ各社を通じて順次サービス提供していく予定だそうです。これにより、より多くの企業や組織が、この高性能なLLMを日々の業務に活用できるようになるでしょう。

NTTは、これからも「tsuzumi」の研究開発を継続し、お客様に価値のあるサービスを提供できるよう努めていくとのこと。AIの技術は日進月歩ですが、日本のビジネスシーンに特化した形で進化を続けるtsuzumi 2が、私たちの働き方をどう変えていくのか、今後の展開から目が離せませんね!

関連情報

過去の報道発表もぜひチェックしてみてください。