Technology
Entry Systems GEES/JES

法人向けクラウド名刺管理サービス「Sansan」や名刺アプリ「Eight」の根幹を支えているのは、取り扱うデータの「正確さ」です。企業名や氏名、電話番号、メールアドレスなどを正しくビジネスで活用するために、限りなく100%に近い高精度の名刺のデータ化が求められます。

その品質を一手に担うのが、Sansanのデータ統括組織DSOC(Data Strategy & Operation Center)が開発する名刺のデータ化システム「GEES」と人事異動情報のデータ化システム「JES」。ビジネスインフラになることをVisionに掲げるSansanにとって、「ビジネスインフラのインフラ」とでも言うべき、コアのテクノロジーです。

「GEES」は、高いセキュリティで、素早く、ミスなく、低コストに名刺をデータ化するためのシステムです。スマートフォンやスキャナーから取り込まれた名刺画像は、独自のアルゴリズムにより項目ごとの分割および項目名の分類が行われます。さらに、セキュリティに配慮して姓名や電話番号、メールアドレスなどの情報を個人が特定できないレベルまで切片化。分割された画像を基に、全国各地にいるオペレーターが入力を行い、精緻なデータ化を実現します。


「JES」は、所有する名刺に紐づく人物の人事異動が公開された際に、その情報を「Sansan」や「Eight」のデータに反映させるためのシステムです。情報源となるのは、企業が公開するWebページやPDF、送付されたEメールなど不定形なものばかり。OCRや自然言語処理、人の手によるオペレーションの長所を組み合わせながら、データ化・構造化を行います。

「GEES」と「JES」の開発は、終わりなき改善の連続です。名刺データ化の速度を向上させコストを下げるには、システムが担う工程を増やして人間が介在する工程を減らす必要があります。しかし現代のOCRや自然言語処理の技術だけでは、精度99.9%のデータ化を実現できません。データの品質を担保するうえでオペレーターの存在は欠かせないのです。品質・コスト・速度・セキュリティの各要素は、「GEES」と「JES」においては常にトレードオフの関係。最適なバランスを模索しながら、システムを改良し続ける姿勢が求められます。

データと向き合う作業は、決して楽しいことばかりではありません。やりたいことがなかなか実現せず、苦しい気持ちになることもあります。それでも歩みを止めないのは、私たちのコードがユーザーのビジネスを支えているという「誇り」があるからです。

エンジニアの新たな発想が、データ化の効率を劇的に向上させるかもしれない。より良いアーキテクチャが、さらなる高精度のデータを実現するかもしれない。そんな瞬間に立ち会えることが、「GEES」と「JES」の開発に携わる醍醐味です。

Members InterviewEntry Systems エンジニアインタビュー

Entry Systems GEES/JES
技術本部サービス開発部 GEES/JES/COEグループ
湯村直樹

Technology Stack技術スタック・開発プロセスについて

CultureSansanエンジニアのカルチャーについて

RecruitmentSansanエンジニアの採用について