ビジネスにおける生成AIの活用は、正確なビジネスデータがあって初めて大きな価値を発揮します。
Sansanは、名刺や請求書、契約書といったアナログな情報を、正確にデータ化する独自のテクノロジーを保有しています。
機械学習、生成AI、人力を組み合わせ、正確性とスピード、セキュリティーを担保する独自のデータ化オペレーションを確立。
長年の運用で磨き上げた技術やノウハウを基盤に独自の生成AIを開発し、プロセスのさらなる効率化を実現しています。
独自に研究開発したさまざまな画像認識技術によって、高速かつ高精度でデータ化を行っています。
NineOCRは、名刺の項目属性を識別する検出器と、人名や名刺特有の表現を高精度に読み取る認識器からなる、名刺に特化したOCRエンジンです。NineOCRの開発により、従来のOCR技術における精度の課題を解消し、高精度を実現しながらデータ化コストを削減しています。
Violaは、さまざまな文書データを学習した視覚言語モデル(Vision Language Model)をベースとした生成AIです。
事業領域ごとのデータ化ルールに応じたドメイン特化モデルをAPI化してシステムに組み込み、データ化エンジンとして稼働しています。
Celloは、Violaに位置情報の出力機構が加わったAIモデルです。
位置情報を出力することで、細かな文字の情報抽出をNineOCRなどと連携して行えるため、データ化精度の向上を実現します。
本モデルの開発は、経済産業省とNEDOが実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の支援を受けて実施しています。
上記の内容を動画で
分かりやすく紹介します。
Sansanは、「出会いからイノベーションを生み出す」というミッションを掲げ、ビジネスの当たり前を変えていく会社です。名刺、請求書、契約書といった出会いから生まれる一次情報を、ビジネスで活用できるデータへと変えていくことでイノベーションを生み出そうとしています。
当社は長年、データ化ルールを基盤に、機械学習や生成AI、そして人の手による品質管理を組み合わせた仕組みを磨き上げてきました。独自の画像処理や自然言語処理の技術を開発し、精緻に構造化されたデータを生み出すことに真摯に取り組み続けています。
ビジネスAIの推論精度は、土台となるデータの品質に直結します。ノイズが混在する非構造化データは、AIの致命的な誤認を引き起こす原因となります。AIを実務で機能させるための技術的な絶対条件、それは推測を完全に排除し、正確に読み解けるよう構造化された「事実」のデータを用意することです。
この「正確なデータ化と品質管理を徹底してやり抜く運用力」こそが、当社の独自の価値です。培ってきたこれらのテクノロジーが、働き方を変えるAXサービスの実現につながっています。
執行役員/CTO
笹川 裕人