About

1. Sansan株式会社とは

■Sansanのミッション - “ビジネスの出会いを資産に変え、働き方を革新する”

Sansan株式会社は“ビジネスの出会いを資産に変え、働き方を革新する”というミッションを掲げ、サービスを通じ世界を変える新たな価値の提供を目指しています。

■事業紹介

2007年の創業以来一貫して出会いの価値を最大化するクラウド名刺管理サービスに特化して事業を展開しています。2007年から法人向け『Sansan』、2012年から個人向け『Eight』という2つのプロダクトを提供しています。

・名刺を企業の資産に変える『Sansan』

「名刺を企業の資産に変える」をコンセプトに、組織内の名刺をデータベース化して共有する法人向け名刺管理サービスです。名刺をスキャナやスマホアプリで読み取るだけで、独自のオペレーションシステムにより名刺情報が正確にデータ化され、クラウド型アプリケーションを通して組織内で名刺情報を共有・活用できます。2017年7月現在、導入企業は6,000社を突破しています。

・100万人が使う名刺アプリ『Eight』

名刺をベースにした国内最大規模のビジネスSNS。名刺の高度な読み取り技術と手入力を組み合わせた、速くて正確なデータ登録に定評があります。日々名刺交換によって広がるビジネスネットワークを活用するための機能として、ビジネスの情報交換ができる「フィード」や、気軽に連絡できる「メッセージ」、名刺にない自分を表現できる「プロフィール」を搭載。2016年12月には、人と企業のつながりを可視化する「企業ページ」をリリースし、名刺データを活用した新たな試みにも挑戦しています。

2. サービス価値の根源
- 独自の名刺データ化システム

■Sansan株式会社の名刺データ化部門とは

『Sansan』と『Eight』が提供する価値は、ユーザがスキャナやスマートフォンで取り込んだ名刺情報を、データ化することから始まります。2つのサービスの最大の強みは、機械と人力を組み合わせた正確なデータベース構築にあります。
現在『Sansan』と『Eight』に取り込まれる名刺の枚数は、合計で年間数億枚にのぼります。Sansan株式会社では創業当時より名刺データ化の専門部門を設置しています。この大量の名刺を正確かつ効率的にデータ化する独自のオペレーションシステムを開発・運営し、事業の成長を支える根幹を担っています。

■データ化部門の歴史

Sansan株式会社の創業以前にも、世の中に名刺管理ソフトは多数存在していました。しかし、データ化技術の主流であるOCR(Optical Character Recognition=光学文字認識)だけでは読み取り精度が低く、ユーザが自分で修正する必要があります。通常のドキュメントに比べて名刺は非定型で、フォントやフォントサイズ、段組み等、フォーマットが決まっていないからです。
名刺情報は1文字間違いがあってもデータとして価値がありません。例えば、Eメールアドレスにアルファベットの「l(エル)」と数字の「1」など判別しづらい文字があったとします。その1文字が間違っていただけでも、メールは届きません。また、名刺は読み取った文字におけるラベリングの判断を必要とします。様々な表現がある中で「これが役職なのか、それとも資格なのか」という微妙な判断が必要になるのです。
このようにビジネスシーンにおいて、紙の名刺を本当の意味で活用するためには、高精度のデータ化が不可欠です。Sansan株式会社では、コストをかけても精度を優先すべきと判断し、テクノロジーとオペレータの人力を組み合わせるという選択をしました。現在データ化システムの精度は99.9%を実現しています。

創業初期は、オペレータが専用システム内の名刺画像を見ながら1枚ずつ手入力していくアナログな体制でした。その頃の技術の役割は、効率的にタスクを配分する裏側の仕組みや、効率が落ちないようにゲーミフィケーションを取り入れるなど、人力の有効活用を前提に最適なフローを構築することでした。当時はデータ化する規模感も毎月100万枚程度だったため、まだ対応できる状態でした。
その後サービスの急成長に伴い、増加していく名刺のデータ化に対応するため、有限のリソースを超える独自技術の研究開発を目指し、2013年より文書画像解析のスペシャリストが専門的な研究を行うR&D(Research and Development)部門を創設しました。OCRに加え、事業のグローバル展開も見越した、言語に依存しない独自の画像解析エンジンや、機械学習を用いて名刺の読み取りを効率化・自動化する研究開発をスタートしました。効率化・自動化を進めるにあたり、精度を維持したままコストの削減も実現しました。現在では世界に類を見ない処理量と精度を保っています。

■名刺データ化システム『GEES』のプロセス

R&D部門の設立を経て進化した独自開発の名刺データ化システム『GEES』。名称は以下の頭文字を組み合わせています。

【Global】より世界中のリソースを利用できる(日本語以外は地産地消で解決できる)
【Elastic】繁忙/閑散期を柔軟に吸収できる伸縮自在な体制を組める
【Efficient】より効果的な方法で役割配置できる
【Scalable】よりスケーリングできる

『GEES』構築の前提には、名刺のデータ化に自社のセンターオペレータ以外のリソースを活用するという方針があります。それを実現するのが「マイクロタスク(誰でも、いつでも、どこでも、隙間時間で、事前準備不要)×マルチソーシング(センターオペレータ、在宅オペレータ、海外オペレータ、クラウドソーシング)」です。技術の力で名刺画像を分割して作業単位を小さくすることで、精度とセキュリティを担保しながら、限られた人的リソースを効果的に活用する仕組みです。現在は全世界で毎月数十万人のオペレータが日々名刺のデータ化を行っています。
将来的には限りなく人力の工程を減らし、完全自動化を目指しています。

・『GEES』によるデータ化フロー
スマートフォンで撮影して取り込まれた名刺画像は、まず背景から4頂点を切り出すトリミングと影の除去、文字を際立たせるホワイトニングを行います。スマートフォン本体や手の影、照明の色に影響されないよう、一定の品質を担保しています。
そして作業の簡略化(マイクロタスク化)のために、項目ごとの分割および項目名の分類を、深層学習(Deep Learning)を併用した独自のアルゴリズムで解析します。また、セキュリティに配慮し、氏名やE-mail、携帯電話番号などは、情報として価値がないところまで再度画像を分割(切片化)します。この処理によって、入力オペレータが名刺かどうかも判断出来ないレベルまで分割しています。
その後、切片化された画像をもとに項目を入力します。この際入力ミスを防ぐために1つの項目につき複数のオペレータによる多重入力を実施し、結果を照合することで精度を高めます。人の間違い方には癖があるため、その間違い方の癖も機械学習で学び、精度を補完していきます。
そして各項目でオペレータの目視も含めたチェックを行い、最終的に1つの名刺情報データに集約して納品します。名刺1枚あたり平均して約20の工程があり、全てのタスクを合計すると毎月6億タスクを処理していることになります。

3. Sansanのデータ資産

■名刺情報の価値

名刺とは何でしょうか。自分が何者かを説明するツールであり、相手の肩書きや連絡先などが網羅された情報です。同時に、相手の名刺を持っているということそのものがコンタクト情報となり、「出会いの証」といえる側面をもっています。名刺はビジネスの基本ツールとして必ず交換するものです。つまり、非常に網羅性の高いデータベースになりえます。そしてほとんどの場合、名刺には正しい情報を記載します。極めて正確性の高い属性情報、プロフィールが名刺には記載されているのです。
また、名刺の内容は必要に応じて更新されます。転職や異動・昇進、また会社の移転など、そのたびに新しい名刺を作成して交換します。歴代の名刺を管理するということは、ビジネスプロフィールを履歴として管理することでもあります。データベース上では、1人のビジネスパーソンにおける、人とのつながりや動向が、時間軸に添って記録されていくのです。

そして、名刺は個人の情報だけではなく企業の情報ともいえます。法人向けの『Sansan』は、名刺情報を企業の資産として共有することで、個々のつながりの組織的な活用を可能にします。
また、Sansan株式会社は企業情報データベースや企業間取引データを保有する帝国データバンク(TDB)、約30万件の人事情報を保有する日経テレコンと提携し、それらの情報と名刺情報をマッチングさせることで、よりユーザのビジネスに結びつける機能を開発しています。会社と人とのつながり、人の流れからわかる企業の注力分野など、名刺交換の集合知として知りうる様々な情報を『Sansan』が教えてくれるようになります。

■Sansan株式会社のデータの価値

Sansan株式会社がこれまで構築したデータベースは、データの量、正確性、特異性といった特長を有しています。
独自の名刺データ化システム『GEES』を通じて、年間数億枚の名刺がデータ化されています。単に数億の個人情報の蓄積ではなく、数億の「出会いの情報」が蓄積されているのです。これは他のSNSには存在し得ない量、そして網羅性といえます。
そもそも名刺が持っている情報の正確性に加え、『Sansan』が過去約10年に渡ってデータ化してきたデータベースは、テクノロジーとオペレータのチェックによって非常に高い精度を有しています。この正確性は、機械学習のトレーニングデータとして大きな強みとなっています。

4. データ入力センターから
Data Strategy & Operation Centerへ

■データ生成から活用へ

創業以来約10年に渡って、機械と人力によりサービスの価値を支えてきたデータ化部門は、近年では世界に類を見ない名刺データベースと、高度な専門技術やシステム運用の知見を有する組織に成長しました。
そこで2016年11月から、部門名をオペレーション部から「Data Strategy & Operation Center」と改めました。名刺管理サービスから働き方を革新するサービスへとプロダクトが進化することに伴い、テクノロジーの力で事業を牽引する戦略部門として位置付けています。
名刺を管理するためのデータベース生成に加えて、今後はこれらのデータをどう活用していくのか、データから得られる知見をサービスとしてどう提供していくのか等、広い視野をもってデータ化に取り組んでいます。

では、『Sansan』が有するデータから生まれる「新たな価値」とは、どんなものがあるでしょうか。いくつか例を挙げてみます。
Sansan株式会社が、これまでデータ化した数億にのぼる名刺のプロフィール情報と、外部の企業情報を連携させたビジネスデータベースを作ることができます。名刺を1枚スキャンすれば、その会社、その人の属性情報(どういった経歴で何が強みなのか)が、全て可視化されるようなキーワード情報を構築することができます。キーワード自体が変化・進化することで、固定的な概念ではない分類、さらには粒度の細かい属性として扱うことができます。
そのデータベースは、ビジネスにおけるあらゆるコミュニケーションの土台になるインフラといえます。通常、私たちは取り引きすべき相手と出会うために、情報を検索して相手を探したり、広告宣伝をしたり、アポイントメントをとるためにつながりを探したり、直接営業活動を行うなど、多大な工数をかけています。しかし、このデータベースで出会いのデータを分析すれば、会いたい人や将来会うべき人を予測する事や、今あなたが会った人が今後ビジネスの発展に繋がる事などを、AIがリコメンドしてくれるようになります。自分の予想を超えるアイデアをもたらす出会いや、ビジネスを転換させるような出会いが『Sansan』によって生まれるかもしれません。
同様に、一緒に働く人との出会いも変えるでしょう。こんな人を採用したい、プロジェクトメンバーを探したい、相談できるパートナーとしてプロフェッショナルを探したい…という時に、これまでの人のつながり方や職歴データを分析する事で、求職者に対しては成功パターンの転職方法を、求人者に対しては、属性情報であるキーワードを用いることによって、より細かな母集団を形成させ、ニーズにあった最適な人をAIがリコメンドしてくれるかもしれません。
このように、名刺をもとにしたビジネスデータベースには、働き方を革新する無限の可能性が広がっています。しかし多くの名刺は紙であるがゆえに未だに活用されず、世界中のビジネスパーソンの机の中で眠ったままになっているのです。

■サービスを世界へ

名刺は世界で年間100億枚流通するといわれています。名刺は日本だけの文化ではないか?と思いがちですが、扱い方のマナーなど名刺に対する意識は違っても、どの国でも利用されています。
北米やヨーロッパのスマートフォンアプリのストアでは、ビジネスカテゴリ上位に各種名刺管理アプリがランキングしており、名刺管理に対するニーズは世界中にあることがわかります。
Sansan株式会社では2016年にシンガポールに現地法人を設立し、アジア圏を皮切りに『Sansan』英語版のサービス展開を始めています。名刺のデータ化は日本語がメインですが、ユーザの要望を受けて外国語の対応も進めています。現在は日本語・英語・中国語(簡体字・繁体字)・韓国語・ドイツ語・フランス語のデータ化に対応しており、今後もプロダクトの海外展開に伴い対応言語を順次拡大予定です。

5. Data Strategy & Operation Center
R&D Group

■R&D Groupのミッションと体制

Data Strategy & Operation Center(略称 DSOC)のR&D Groupは専門の研究部門ですが、研究そのものを目的とせず、サービスを通じて世の中に価値を届けることをミッションとしています。

現在は画像処理・機械学習のスペシャリストやデータサイエンティストなど十数名が在籍(海外の著名な競技プログラミング”Kaggle”のGrandmasterも2名在籍)しています。名刺をもとにした人脈のデータベースの活用は、前例のない未知の領域です。そのため、様々なアイデアを持ったメンバーの個々の強みを活かし、クリエイティビティを発揮できる研究開発環境づくりを目指しています。

・開発拠点

東京本社
【サテライトオフィス】 Sansan神山ラボ、Sansan京都ラボ、Sansan長岡ラボ、Sansan札幌ラボ
メンバーの採用に伴い、リモートワークやラボの開設など様々な働き方にチャレンジしています。