データ化技術を研ぎ澄ませ、
まだない価値を社会に届ける
技術本部 研究開発部 シニアリサーチャー
内田 奏/2020年 新卒入社


- インタビュー
- データ化技術を研ぎ澄ませ、まだない価値を社会に届ける
技術本部 研究開発部に所属するシニアリサーチャーとして、Sansan株式会社の各プロダクトに欠かせない「文字認識エンジン」の研究開発に取り組んできた内田奏。文字認識エンジンを開発し、精度を高めていくプロセスや、研究開発職だからこそ届けられる価値など、これまでの歩みと思いを聞きました。
SStories
まだ世の中にない価値を提案できる仕事
研究開発部の一員として、普段はOCR(光学文字認識)エンジンの開発に携わっています。OCRエンジンは、画像の中の文字情報を読み取ってデータ化する際に使用するものです。名刺をスキャンして氏名やメールアドレスなどの文字をデータ化する、といったシーンがわかりやすいかもしれません。Sansanには名刺に特化した独自のOCRエンジンがあるのですが、氏名やメールアドレスはもちろん会社名や役職など、名刺に書かれたすべての情報を正確に読み取れるよう、データ化範囲の拡大や読み取り精度の向上に取り組んできました。もともと大学では画像認識・生成を専攻しており、学生時代に参加したSansanのインターンシップで「画像領域で何かチャレンジしたい」と希望していたこともあって、インターンシップ時には画像系のタスクに、入社後の早い段階からはOCRエンジンの開発に取り組む機会をいただきました。
Sansanに入社したのは、「名刺」という独自性のある面白いデータを扱える環境があったことと、研究成果がすぐ世の中に反映されていくスピード感やスケール感に惹かれたことが大きな理由です。研究開発職は、先端技術を使って、世の中にない価値を社会に提案していける仕事だと思っています。人がまだ見えていない可能性を見せられる職種であり、一つの仕事で、大きくユーザー体験を変えていくことができます。ただ、何かを変えていくためには「塵も積もれば山となる」の精神で、地道な成果を積み重ねることも大切です。OCRエンジンの認識精度をコツコツと上げていくことや、改善し続けるための社内の開発体制構築など、そういった積み重ねが必要な仕事でもあります。

0→1も1→10も、挑戦の連続
OCRエンジンの開発にあたっては、0から1を生み出すフェーズや、1を10にしていく段階それぞれで、いくつも挑戦がありました。まず0→1のところですが、そもそもOCRエンジンを開発していくためのデータというのは、「ある」ようで「ない」のです。もちろんSansanには名刺データ自体は大量にあるのですが、ある機能を実現するためのデータは、どのような形のものがどれだけの量あればいいか考えながら、必要なものを自分たちで用意しなければなりません。ビジネス価値のある問題を解決できるOCRエンジンにするために、正解データと大量の学習用データを社内からかき集めないといけないのです。これが結構大変な作業でして。社内に集まっている膨大な名刺を自分の目で網羅的に見て、OCRエンジンの開発に必要なデータを揃えていく。本当にデータ勝負の仕事です。そういった難しさをクリアしながら開発していくのですが、いざ開発し終えたら、今度は精度を向上させていく1→10の道のりが待っています。
精度を磨き上げていくには、改善のサイクルを整えることが重要です。私は昔から「ボタンを押すだけで自動でどんどん成果が上がっていく」ような、効率の良い仕組みや開発体制を考えることに強い関心があり、それが部署内でまだ十分にチャレンジし切れていない領域だったことから、MLOpsと呼ばれる考え方の導入を提案しました。簡単に言えばMLOpsは「開発から運用までを視野に入れ、機械学習モデルの改善サイクルを素早く円滑に回すための仕組み」です。機械学習モデルは、一度作ったら終わりではありません。運用・改善が非常に大切で、実際にOCRエンジンを使っていく中では、さまざまな改善点が見つかるものなのです。
Sansanの研究開発職は、研究成果を事業やプロダクトに反映して価値を生み出す仕事だと思っているので、運用・改善を効率的に進められるMLOpsはぜひ導入したい仕組みでした。ただ、部署のさまざまな人に関係する開発体制のため、なぜ導入する必要があるのか、話し合いはじっくりと進めました。メンバーが納得できるよう「効率よく改善していける仕組みがあったら素晴らしいと思いませんか」と理想像を共有し、目線を揃えながら導入していきました。その後、多くの人たちの尽力もあって、名刺アプリ「Eight」での文字認識精度を限りなく上げることができました。ついに人の手を介さずに、OCRエンジンだけでデータ化が完結する「完全自動化」という成果が得られたのです。

こうだといいな、という未来を仕込んでいく
文字情報を正確にデータ化できるOCRエンジンがあれば、極端な話、「明日からいきなり数億人がEightを使いはじめます」というような状況が訪れても原理的には対応することができます。これは例え話ですが、私たちが目指している「ビジネスインフラ」は、本来それくらいの規模感で使われていくはずのものだなと。「インフラたるものスケールしていけるように」と思っており、そのために、データ化の当たり前のレベルを上げていきたいと常に考えています。データ化精度が上がっていくほど、自分に課される挑戦のレベルがどんどん上がっていきますが、目標と挑戦を相乗効果で高めていくことが理想です。特に意識することなく「気がついたらSansanのプロダクトを利用していた」という状態がインフラらしいあり方だと思うので、こうだといいなという未来を想像しながら、仕込んだものをきちんと温めて、花開かせていきたいと思っています。
Sansanには「Lead the customer」というバリューもありますが、専門性を生かした提案によってお客さまを引っ張っていけるのは研究開発職ならではです。「OCRエンジンはどれを使おうかな」と選ぶのではなく、「どんなOCRエンジンを作ったらいいだろう」と、大元の部分から開発していけるのはこの職種の強みですね。研究開発職が所属している研究開発部は、この会社のすべてのプロダクトと関わりがある部署です。さまざまなプロダクトの情報や相談が常に届いていますし、こちらから各部署に技術的な知見や示唆を提供していくこともできます。職種や組織の特徴を生かしながら、お客さまにとって価値のある提案ができたらと考えています。

研究開発を楽しみながら、
社会へのインパクトを生み出す
今後の野望として、「Eight」の次に「Sansanでの完全自動化」を叶えたいと考えています。さまざまな精度向上策を実施していますが、地道な改善を積み重ねているだけだと、結局どこかで頭打ちになることがあります。どんなに現行フロー上で精度を高めても、OCR前後の処理との兼ね合いで、システム全体として100%を達成できないケースが出てくるようなイメージです。そうすると、データ化フローにおけるOCRエンジンの担当範囲を見直すなど、抜本的に何かを変えることで突破していく必要があります。ChatGPTで使われている VLM(視覚言語モデル)を活用したアプローチなどで、もう一段上にいけないかという挑戦をしています。
完璧なOCRエンジンがあれば、データ化が一瞬で完了する。そのシンプルさに美学を感じていて、そんな世界の実現を目指しています。大きな目標を達成していくために、興味を持ってくださる方に仲間になっていただけたらうれしいですね。私自身、研究成果を事業やプロダクトに反映することに価値を見出しているので、その研究や技術が世の中でどう使われていくかまで視野に入れて、成果を狙える人と一緒に働きたいです。そういった経験があるかよりも、そこに対する高い感度があるかどうか。もちろん研究開発職としての楽しみは人それぞれで、ゼロイチを生み出すことに情熱を注ぐ人もいれば、コツコツ改善を積み重ねるのが得意な人、物事が自動で進む仕組みを考えるのが好きな自分のようなタイプなど、本当にさまざまです。それぞれの好みや得意を生かしつつ、一緒に社会へのインパクトを生み出していけたらと思っています。

AAchievements
アクションを生み出す原動力と、積み重ねてきた挑戦・成果のサマリーです
原動力
「データ化技術を研ぎ澄ませ、社会に価値を届けたい」
サマーインターンシップ・長期インターンシップ
- 画像の解像度を上げる「超解像」など、画像系のタスクに取り組む
データ統括部門DSOC(当時)でOCR開発
- 画像の影除去技術をリリース
- OCRの認識範囲拡大に挑戦
- チームリーダーに着任
「Eight」のために、OCRエンジンだけでデータ化が完結する「完全自動化」へ挑戦
- MLOps導入をはじめとする開発体制の整備
- シニアリサーチャー着任
「Sansan」のために、OCRエンジンだけでデータ化が完結する「完全自動化」へ挑戦
- VLM(視覚言語モデル)を活用したアプローチなどに取り組む
- さらなる挑戦を積み重ね、ミッション・ビジョンの実現へ
一歩を踏み出す人が、
世界を変える人になる