mimi

Sansanの
人・組織・カルチャーを
伝えるメディア

2018年度 人工知能学会全国大会に協賛しました

こんにちは。DSOC R&Dグループ研究員の吉村です。

最近は、社内で深層学習を数式から勉強し直そうということになり、深層学習に関する書籍の輪読勉強会をしています。

JSAI2018に参加

2018年6月5日から6月8日にかけて鹿児島県鹿児島市で行われた 2018年度 人工知能学会全国大会(JSAI2018)に、Sansanは昨年(2017年のレポート)と同様にプラチナスポンサーとして参加しました。

本記事では、その模様とそもそもSansanと人工知能(AI)がどのように関係しているのかをお伝えします。

JSAI 2018は、鹿児島市の市内から山を登った先にある城山ホテル鹿児島で行われました。会場が山の上にあるホテルだったこともあり、会場から桜島や鹿児島市内が一望できました。

とても広い会場であったにもかかわらず、どの発表会場も多くの人で賑わっていました。近年、急速に参加者数が増加しているJSAIですが、今年も大盛況だったようです。

速報によると、参加者数が2572人に登ったそうで、これは過去最多人数だったようです。昨今の人工知能ブームの熱が感じられます。

セッションの様子。大盛況です。

Sansanからは、DSOCの所長である常樂と研究員の糟谷中野真鍋、私の4人に加えて、R&D戦略室の田中という計6人で参加し、企業ブースを出展して展示も行いました。

また、中野はインダストリアルセッションで「ビジネスの出会いを変えるAI技術応用事例の紹介」と題した発表も行いました。

ブース出展

Sansanの企業ブース前で撮影。左から、中野、田中、吉村。

企業ブースでは、法人向けクラウド名刺管理サービス「Sansan」内で展開している「Sansan Labs」や「スマートレコメンデーション」を紹介する展示や、研究員の西田戸田が著した『DSOC Data Science Report』の冊子版も配布しました。

Sansanのブースには、中野のインダストリアルセッションでの話を聞いて興味を持ってくださった学生の方や企業の方々、そして大学の先生方が話を聞きにきてくださいました。

改めて、Sansanのブースへ足を運んでいただいた皆さま、ありがとうございました。

会場では、鹿児島名物の白くまが振る舞われていました。

Sansanと人工知能(AI)

さて、多くの方が「Sansanが人工知能とどういう関係が?」と思われているのではないでしょうか。簡単にSansanと人工知能技術との関係を説明したいと思います。

Sansanでは、すでにいくつかの人工知能技術を大きく分けて2つの場面でプロダクトに導入しています。そのひとつが名刺をデータ化する場面、もうひとつがデータ化された名刺情報を活用する場面です。

名刺をデータ化する場面では、例えばスキャンされた名刺に書かれている文字列が何を表すのか(名前なのか、住所なのか、会社名なのか、など)を推定するために深層学習を利用しています。この処理を項目判定と呼んでおり、創業から現在まで蓄積してきた名刺の画像データと項目と位置の情報を用いて学習することで、高精度に文字列の項目を予測・判定します。

データ化された名刺情報を活用する場面としては、前述のSansan Labsやスマートレコンメンデーションが挙げられます。

Sansan Labsでは、ビジネスを後押しするための新たな価値を創造するために、これまでにデータ化された名刺の情報を分析することで、さまざまな機能を開発しており、それぞれの機能を実現するために人工知能技術が応用されています。また、スマートレコメンデーションとは、名刺の交換情報からユーザーが次に名刺を交換するべき人を推薦する機能です。こちらでは、人工知能技術の1つであるレコメンドアルゴリズムが用いられています。

ここに示したものは一例ですが、Sansanではいろいろな場面で人工知能技術を活用しています。

研究発表・講演の聴講

学会といえば、メインとなるのは研究発表です。2018年のJSAIでも幅広い分野の研究発表がありました。ここでは、特に興味深かった発表をいくつか紹介します。

こちらは題目の通り、Stacked RNNで桜島の噴火予測を行なった研究です。発表者の方によりますと、先行研究はほとんどなく、他の火山の研究結果においてもSVMを使ったものしかないとのことで、今後の発展性を感じました。おそらく火山ごとに独自の予測関数があるのではと考え、それらをデータサイエンティストが競い合って高精度にしていく未来もあるのかなと感じました。

特定の組織内で蓄積されたテキストデータを、利用しやすくするためのシステムを構築する研究です。この研究で提案されているシステムは、インプットとして質問文とカテゴリーを受け取り、アウトプットとして要約済みの回答を返します。この研究で特に工夫されているところは回答を検索する部分で、質問文中の類似語も利用する点です。これにより、類似語を利用しない場合に比べて検索ヒット数が5割程度増加しているようです。この研究では評価実験を定量的に行うことが難しそうで、ビジネスにおけるAI活用の課題を表していると感じました。

クックパッドさんでは、フィーチャーフォン時代の画像を超解像するに当たり、パンの画像に対してはパンの画像で学習したモデル、肉の画像に対しては肉の画像で学習したモデルを用いることで、適切なテクスチャーを生成できるようになったそうです。Sansanが展開する、個人向け名刺アプリ「Eight」はインドでもサービス展開をしているのですが、日本と比べて携帯端末のカメラ性能が低いことが多く、データ化精度向上のために超解像技術にも注目しています。名刺画像を超解像する場合でもアルファベットの多い項目と漢字の多い項目では、別のモデルを準備するべきかもしれません。

  • JSAI Cup報告会

ここでは、学会に先立ち実施されたJSAI Cup 2018の上位入賞者のソリューションが発表されていました。入賞者のほとんどが、Random ErasingやMixupといった比較的新しいData Augmentationを利用していたのが印象的でした。画像分類というタスクについては、学習データが少なく学習済みモデルの利用できないシビアな状況にあっても適切なData Augmentationによってビジネス上問題ない精度のモデルが獲得できるようになったと講評されていました。

一方で、優勝者にはTeacher CNNを利用した工夫が見られ、精度を突き詰めたい状況においては、通常のアプローチと異なったものも必要になってきそうです。また、このコンペティションはアンサンブルを禁止したことでも話題になっていたのですが、多くの入賞者の方は推論時に画像を100倍以上水増しすることで予測を安定させており、計算負荷がビジネス的な要件を満たしているか、疑問もあります(コンペティションのモデルをそのまま本番環境に載せる訳ではないのですが、アンサンブル禁止との整合性が気になりました)。Sansanでも社員向けに画像認識コンペティションの開催を計画していますが、今回の事例を参考にルールの設計をしたいと思います。

  • 画像・映像認識(チュートリアル講演7)

Mask R-CNNという深層学習のフレームワークを例に取って、画像認識における分類、物体検出、セグメンテーションと、それぞれのタスクについて分かりやすい解説がなされました。また、画像セグメンテーションや映像認識の学習用データを自前で用意することは通常困難であり、公開されているデータセットについて紹介があったことも興味深かったです。

  • ヒューマンコンピュテーションとクラウドソーシング(チュートリアル講演8)

人間と人工知能を組み合わせることにより、どちらか片方だけでは解決できないような難しい問題の解決を図るヒューマンコンピュテーションの事例から、その事例の一つであるクラウドソーシングに関する最新の研究まで、紹介がありました。Sansanでも名刺のデータ化にクラウドソーシングを利用しているため、活用できるところを探しながら聴講しました。

交流会

私は、2018年に新卒社員として入社し、DSOCのR&Dグループに配属されたため、同じように研究職に就いている方々と交友を深めたいと思い、交流会にも参加しました。

  • AI若手の会

「AI若手の会」には、学生や企業の研究者の方、大学の先生方など、さまざまなバックグラウンドを持つ方々が参加されていました。昼の部、夜の部と二部制で開催され、私は両方に参加しました。

昼の部では、それぞれが行っている研究や、最近気になった研究、尊敬する研究者などについてお互いに話をしました。その中で新たな気付きを得られる部分などが多くあり、たくさん学ばせていただきました。

夜の部では、各人の研究内容についてより深い話を聞き、各々が自分の意見を言い合うような和気あいあいとした雰囲気の会となりました。やはり、皆さん、研究者の先輩ということもあって、鋭い観点から意見をおっしゃっていて、見習うべきところがたくさんありました。それに加えて、Sansanがお世話になっている先生からは、いま行っていらっしゃる研究についてのお話を直接伺うこともでき、非常に充実した会となりました。

今回は学ぶことばかりでしたが、次回はこちらから情報を出していけるように大きく成長していこうと心に刻みました。

  • 参加者交流会

参加者交流会では、鹿児島名物の黒豚のしゃぶしゃぶ、さつま揚げ、キビナゴの天ぷらなどが振る舞われました。さまざまな学生の方々と話をさせていただき、現在行われている研究についての話をお聞かせいただいたり、自身の研究についてのお話をさせていただきました。

参加者交流会の様子。多くの方が参加されていました。

JSAI 2018の4日間を通して

この4日間で、多様な方々と交流することができ、さまざまな研究に関する知見を広げることができたと感じました。また、鹿児島という土地についても、さまざまな学びを得ることができ、非常に充実した学会参加となりました。

今回の学会参加で得られた知見を積極的に生かして、東京の表参道本社でビジネスにおける新たな価値の創造にまい進していきたいと思います。

また、Sansanでは新卒・中途問わず、機械学習、自然言語処理、データマイニング、ネットワーク分析、画像処理など、人工知能に関する技術を持ったエンジニアや研究者の方々を募集しています!

少しでも興味を持たれた方、具体的な話を聞いてみたいという方がいらっしゃいましたら、吉村までお気軽にメッセージをいただければと思います!

text: DSOC R&Dグループ 吉村皐亮