動画を撮るだけでPC業務が自動化!カラクリの国産AI「KARAKURI VL2」が年間200時間の業務削減を実証!

PCを使った日々の業務、もっとスムーズに、もっと効率的にできたらいいのに……。そんな願いを叶える、驚きのAIアプリケーションがカラクリ株式会社から登場しました!なんと、動画を撮るだけでPC業務が自動化できちゃうというから驚きです。この国産AIは、コンタクトセンターの現場で年間約200時間もの業務削減を実現したんですよ。

開発の背景:コンタクトセンターの「困った!」を解決

日本のコンタクトセンター市場は、約1兆円規模とも言われる巨大な業界です。ここでは、CRM、メール、チャット、社内ナレッジなど、本当にたくさんのツールを使いこなして業務にあたっています。毎日毎日、定型的なPC操作が山のようにあるんです。

これまでにも、RPA(ロボティック・プロセス・オートメーション)のような業務自動化ツールはありました。でも、これらを導入するには、専門のエンジニアさんがシナリオを構築したり、API連携を設定したりと、かなり専門的な知識や手間が必要でした。現場のスタッフが「ここを自動化したいな!」と思っても、なかなか自分たちの力で進めるのは難しかったんですね。

そんな現状を打破するために、カラクリは「新人に教えるように、AIに教える」という、とってもユニークなコンセプトを掲げました。プログラミングの知識がなくても、業務の様子を動画で撮影するだけで、自動化をスタートできるAIアプリケーションの開発に成功したんです。

「動画を撮るだけ」の3ステップで業務自動化が実現!

この新しいAIアプリケーション、使い方はとってもシンプルなんです。たったの3つのステップで、あなたのPC業務が自動で動くようになります。

業務プロセスをAIで自動化する3ステップを示した図

ステップ1:業務を撮影する

まず最初にすることは、自動化したいPC業務を画面録画することです。まるで新人の同僚に仕事を教えるかのように、普段通りにPCを操作しながら、口頭で操作内容を説明していきます。「ここをクリックして、この情報を入力してね」といった具合に、自然な言葉で話しかけるだけでOKなんです。特別な準備や難しいスクリプトは一切不要。いつもの業務をそのまま記録する感覚で、手軽に始められます。

ステップ2:マニュアルを自動生成する

撮影した動画は、Google社の大規模言語モデル「Gemini」が解析します。Geminiは、動画内の画面の動きや変化、そしてあなたが話した音声での説明を統合的に理解する能力を持っています。その結果、人間が読んでも分かりやすい、そしてAIが再現可能な詳細な操作手順書を自動で作成してくれるんです。まるでベテランの先輩が、あなたの操作を見て完璧なマニュアルを作ってくれるようなイメージですね。これにより、マニュアル作成にかかる時間と労力を大幅に削減できます。

ステップ3:AIが業務を自律実行する

最後に、カラクリが独自に開発した国産視覚言語モデル「KARAKURI VL2」の出番です。このAIは、ステップ2で生成された手順書に基づいて、PC画面をまるで人間の目で見ているかのように認識します。そして、手順書通りにマウスを動かしたり、キーボードを操作したりと、PC業務を自律的に実行してくれるんです。初期設定に必要な時間は、業務動画の撮影とアップロードを含めて、なんとたったの約15分!これまでのRPA導入に必要だった膨大な時間やコストを考えると、まさに画期的な進化と言えるでしょう。

TENTIAL実証実験で年間200時間の業務削減効果を確認

このAIアプリケーションがどれほどの効果を発揮するのか、株式会社TENTIALのカスタマーサポート現場で実証実験が行われました。対象となった業務は、日々大量に寄せられる「お問い合わせの振り分け作業」です。この作業は、内容に応じて適切な担当者や部署に割り振るという、正確さとスピードが求められる定型業務でした。

結果は驚くべきものでした。たった15分の初期設定で、このAIが問い合わせの振り分け作業を自動化し、年間で約200時間もの業務削減効果が確認されたのです。これは、担当者が他のより重要な業務に集中できる時間を生み出し、顧客対応の品質向上にも繋がる大きな成果と言えるでしょう。現場のスタッフにとっても、煩雑なルーティン作業から解放されることで、より創造的で価値のある仕事に時間を使えるようになるはずです。

複数のAI技術を最適に組み合わせたアーキテクチャ

この画期的なAIアプリケーションは、カラクリが設計・開発したソリューションであり、各工程に最適なAI技術が組み合わされています。

工程 担当技術 役割
マニュアル自動生成 Google Gemini 動画の解析および操作手順書の自動作成
PC操作の自律実行 KARAKURI VL2 手順書に基づくPC画面の認識と操作の自律実行
アプリケーション全体 カラクリ ソリューション設計・開発・UI構築

KARAKURI VL2の主な特長

「KARAKURI VL2」は、経済産業省のGENIAC第3期の採択を受けてカラクリが独自に開発した、まさに「国産」の視覚言語モデルです。このモデルには、いくつか注目すべき特長があります。

  • 軽量設計:8B(80億)パラメータという軽量な設計なので、PCなどのローカル環境でもスムーズに動作します。これは、大規模なサーバーを用意しなくても手軽に導入できることを意味します。

  • PC画面の認識と自律実行:まるで人間の目と脳のように、PC画面に表示される情報を正確に認識し、それに基づいて必要な操作を自律的に実行する能力を持っています。これにより、生成されたマニュアルを忠実に再現し、業務を自動で進めることができます。

  • 高いセキュリティ:機密性の高いデータを外部に送信することなく運用できるため、情報漏洩のリスクを最小限に抑えられます。セキュリティ要件が厳しい企業や組織でも、安心して導入できるのは大きなメリットですね。

今後の展望:あらゆるPC業務をAIに「教える」世界へ

カラクリは、この「KARAKURI VL2」を基盤としたAIエージェントアプリケーションのサービス化を強力に推進していくそうです。まずはカスタマーサポートの領域からスタートし、将来的にはレガシーシステムを含む、さまざまなアプリケーション間での操作自動化へと対象を広げていくとのこと。

「人に教えるようにAIに教える」というコンセプトは、まさにデジタルトランスフォーメーション(DX)の加速を予感させます。きっと、将来的には経理業務の複雑なデータ入力も、人事部門での書類作成も、このAIが手助けしてくれるようになるでしょう。あるいは、営業部門での顧客情報更新や、マーケティング部門でのデータ集計作業なども、動画を撮るだけで自動化できるようになるかもしれませんね。あらゆるPC業務が、もっとシンプルに、もっと効率的に実行される世界が、もうすぐそこまで来ているのかもしれません。

カラクリ株式会社について

カラクリ株式会社は、「FriendlyTechnology」をビジョンに掲げ、大規模言語モデル(LLM)のカスタマーサポートへの実用化を目指すAIスタートアップです。2018年からBERT、2022年からはGPTを含む大規模言語モデルの研究に精力的に取り組んでいます。同社が提供するカスタマーサポート向けAIシリーズは、高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾートといった、各業界のトップ企業に選ばれ続けている実績を持っています。

主な実績

  • 2018年 ICCサミット「スタートアップ・カタパルト」入賞

  • 2020年 Google for Startups Accelerator2020に採択

  • 2022年 Google for Startups Growth Academy Tech 2022に採択

  • 2023年 AWS LLM開発支援プログラムに採択

  • 2024年 生成AI実用化推進プログラムに認定

  • 2024年 Meta社 完全招待制の生成AI開発者会議に参加

  • 2024年 経産省「GENIAC」に採択

会社情報

  • 住所:〒104-0045 東京都中央区築地2-7-3 Camel 築地 II

  • 設立:2016年10月3日

  • 代表者:代表取締役CEO 小田 志門

  • 事業内容:カスタマーサポート特化型AI「KARAKURI」シリーズの開発・提供・運営など

関連リンク