mimi

Sansanの
人・組織・カルチャーを
伝えるメディア

【Techの道も一歩から】第4回 「第16回情報科学技術フォーラム(FIT2017)で登壇」

こんにちは。DSOC R&Dグループの高橋寛治です。

Tech道を歩む中で避けられない一歩である「登壇」を第16回情報科学技術フォーラム(以下「FIT2017」)にて経験してきました。今回は、そのときの発表内容などをレポートしたいと思います。

情報科学技術フォーラムとは?

情報科学技術に関する交流の場です。もともとは、電子情報通信学会と情報処理学会で重複する分野が出てきたため、両学会の合同大会を開催することを目指して、「情報科学技術フォーラム(FIT:Forum on Information Technology)」が創設されたそうです。 
参考:FIT情報科学技術フォーラム創設の経緯

ビジネスにおける研究活動を伝える

FIT2017は、2017年9月12日〜9月14日の3日間、東京大学本郷キャンパスで開催されました。私は9月14日にイベント企画の「【学生向け】AI TECH TALK 次世代を担う学生へ 〜ビジネス最先端の企業が語る人工知能関連テクノロジー〜」で登壇しました。これは、企業が学生の方々にビジネスにおける研究活動を伝える場として企画されたものです。

私の講演タイトルは、「名刺管理におけるデータの入力と活用」。それでは、当日に使用したいくつかのスライドのタイトルとともに当日の発表内容を簡単に紹介したいと思います。

以下は、私が話していると思って、読んでもらえればと思います。

そもそもSansanとは?

Sansan株式会社は、法人向けクラウド名刺管理サービス「Sansan」を展開している企業です(「Eight」という個人向け名刺アプリも展開しています)。

名刺には、「顧客情報」と「接点情報」という2つの情報が含まれています。そんな名刺をデータ化して社内で共有することによって、名刺を“価値ある資産”に変えるのが「Sansan」というサービスです。

研究開発のビジネスへの貢献

そんな名刺管理と研究開発のどこに接点があるかというと、名刺データベースを構築するためには大量の名刺をデータ化する必要があります。そして、効率的にデータ化を行うためには、その工程を自動化する必要があります。

その名刺データベースは、ビジネスで利用されるデータベースです。だからこそ、データ化の精度がほぼ100%であることが求められます。例えば、メールアドレスが1文字でも間違っていれば、送信したメールは届きません。

そこで、SansanのDSOCでは、画像処理技術やマイクロタスク・マルチソーシングなどを用いて、コストを抑えつつも高精度な名刺のデータ化に取り組んでいます。

そんな研究開発を行うDSOCのR&Dグループは、「ビジネスの出会いを資産に変え、働き方を革新する」という企業として掲げるミッションを達成するために、日々業務に取り組んでいます。

現場エンジニアのリアル

DSOCのR&Dグループには、文系・理系を問わず多種多様なバックグラウンドを持ったメンバーが在籍しています。特に機械学習に造詣の深いメンバーが多く、Kaggle Grandmasterや『データサイエンティスト養成読本』を執筆している人もいます。

研究開発環境としては、潤沢な計算環境と正確な名刺データがあります。また、最近では所属する研究員が積極的に学会へ参加しています。

実はこのときDSOCの Tシャツを着ていたのですが、残念ながら角度的に見せることができる写真を撮られていませんでした。

文字だけのダイジェストではありますが、私が登壇して話した内容の一部を紹介させてもらいました。

参加企業の発表内容はどれも興味深かった

当日は、Sansanを含めた全部で5企業の社員が登壇しました。さまざまなビジネスにおける情報技術の活用法を聞くことができ、その発表内容はどれも大変興味深いものでした。

最初に登壇されたGRIDさんは、私たちの生活を支える社会インフラに対して、データサイエンスにより問題解決を試みるという、私にとっては非常に身近に感じる内容の話をされていました。問題解決をするために、独自に機械学習および深層学習のフレームワーク「ReNom」を開発されているとのことで、OSSへの貢献も大変素晴らしいと感じました。

続いて登壇されたのは、SoftBankさんでした。機械学習を利用した際に、現場で起こりがちなさまざまなことを発表されていました。自然言語処理において、ルールベース処理の性能が高く、機械学習を用いてもなかなか打ち勝てないというような、自然言語処理の研究をする私にとっては非常に身に染みる内容の講演でした。

3番目に登壇した私の後に登壇された本田技研工業さんは、自動運転システムの話を中心に情報技術の関わりについて話をされていました。モータースポーツが好きな私は、前のめりで聴講してました(笑)。一括処理ではなく、細かいタスクに分解して自動運転システムを実現させる話は、未来を感じてとても面白く感じました。

最後に登壇されたのが、楽天技術研究所さんでした。大規模データ分析向けの分散SQLデータベースについて講演されていました。本当に大規模なデータをさばいている企業は、自社でデータベースのような低レイヤーの実装に取り組んでいることを知りました。

実応用を想像してもらえるような発表を

当日は、用意したSansanのCM映像が流れないというトラブルもあり、久しぶりに広い会場で講演したこともあってか、かなり緊張してしまっていたと思います。そのようなこともありましたが、講演後に多数の質問をいただけたことで、発表内容が伝わっていたことが実感できて、ホッとしました。

今回の登壇においては、発表できる範囲で情報技術とビジネスの関わりをかなり具体的に紹介しました。私の発表を通して、学生の皆さんに実応用を想像してもらえていたなら嬉しいです。

この日は、学生の皆さんに負けないように、今後も研究発表を行っていこうと改めて思えた、良い機会となりました。

昼食抜きで登壇したため、登壇後に食べたステーキの味は格別でした

執筆者プロフィール

過去記事

▼第3回
第11回テキストアナリティクス・シンポジウム

▼第2回
R&D論文読み会勉強会

▼第1回
言語処理100本ノック勉強会

text:DSOC R&Dグループ 高橋寛治