2017.08.07

研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

こんにちは。先日、8月2日に誕生日を迎えました、人事部のびんです。

7月29日(土)、初の試みとして、機械学習、画像処理、データ分析を専攻する学生に向けたイベント「Kaggle Student Meetup by Sansan」を開催しました。

このイベントは、世界中のデータサイエンティストが参加するデータ解析コンペティションなどが催されているプラットフォーム「Kaggle」の勉強会として、Sansanが主催したものです。

会場は東京と京都の2カ所。それぞれの会場をWeb中継でつなぎ、同時開催としました。さらに、当日はWeb中継による生配信も実施し、遠方に住まわれる学生の方にもオンラインで参加いただきました。

当日は、Sansanに所属するメンバーたちが登壇し、70名を越す全国の学生の方々へ向けて、さまざまな自身が取り組んできたテーマで発表を行いました。また、発表後には、LT(ライトニングトーク)、懇親会も行い、参加者の方々には、満足してもらえたのではないかと思っています(イベント後のアンケートによると、来場者の満足度は高かったです!!)。

豪華すぎた登壇者!?

先日に公開された、こちらの記事でも紹介させていただいた2名をはじめ、SansanにはKaggleの最上位称号である「Grandmaster」を所持する複数人のメンバーが在籍しています。

当日は、Grandmasterの一人が京都会場で参加したほか、東京会場では上記の記事では登場しなかった、ほかのGrandmasterに加え、「Master」の称号を持った研究員も登壇、それぞれのテーマで発表を行いました。

自社のイベントで言うのもおこがましいですが、本当に豪華なMeetupとなったと思います。

20170802155730 d62656afc799faa4646f489e24c56642331d002d - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

DSOC研究員の中野良則による発表の様子。テーマは「データ解析コンペティションとXGBoost」。Web中継もバッチリでした

20170802155735 6fd34b249879e4473d2599ce80335f9a78efc7d7 1 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

同じくDSOC研究員の黒柳敬一(Kaggle Master)の発表。テーマは「Airbnb New User Bookingsの事例で学ぶStacking応用編」

20170802155736 02ed299eaebddb61e92c3a00f667135ce8ff9aa9 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

R&D戦略室マネジャーの池西亮も登壇。テーマは「Sansan×データ分析の可能性」

20170804191534 a189e5f0f1d6158d08dbc059f9e6820395db9ba1 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

京都会場では、KaggleでGrandmasterを所持する当社研究員が中継内容を解説しました

後半戦のLTも盛り上がりました!

20170802155739 9fc7710ad7c6f6790864da9ca85aef2598eccb59 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

後半に行った、DSOC R&DグループのメンバーたちによるLTの様子。1人目は、機械学習による画像認識、自然言語処理を専門とする河合俊典

20170802155739 34fd7dddf1c3fadb2b9abb9aaa48048d41de7a5d - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

LTの発表者2人目は、林愛空。リコメンデーション、最適化が専門

20170802155741 a3f650692318938da23d0ec808d1b353e6aeae83 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

最後となる3人目は、本年度に新卒入社した髙橋寛治。自然言語処理、Webマイニングが専門
20170802155741 adb76d61f68c07d8f09bbb117b475c1f5108a356 - 研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

懇親会も大盛り上がり(入る隙間がない・・・)! 用意した食べ物と飲み物は、あっという間になくなってしまいました

Sansanがデータサイエンス領域に注力するワケ

名刺管理サービスを展開するSansanが、なぜデータサイエンス領域にここまで力を注ぐのか。その答えは、Sansanが保有するデータベースにあります。

名刺のデータ化と蓄積された名刺データベースの活用を担う、SansanのData Strategy & Operation Center(DSOC)のウェブサイトでは、このように記載しています。

■Sansan株式会社のデータの価値
 
Sansan株式会社がこれまで構築したデータベースは、データの量、正確性、特異性といった特長を有しています。 
独自の名刺データ化システム『GEES』を通じて、年間数億枚の名刺がデータ化されています。単に数億の個人情報の蓄積ではなく、数億の「出会いの情報」が蓄積されているのです。これは他のSNSには存在し得ない量、そして網羅性といえます。 
そもそも名刺が持っている情報の正確性に加え、『Sansan』が過去約10年に渡ってデータ化してきたデータベースは、テクノロジーとオペレータのチェックによって非常に高い精度を有しています。この正確性は、機械学習のトレーニングデータとして大きな強みとなっています。

このように「Sansanのデータベースには価値がある」と、我々は考えています。だからこそ、こういったイベントの開催などを通して、その価値につながるデータサイエンス領域を今回に限らず盛り上げていきたいと考えています。

絶賛募集中です!

最後にこの場を借りて、一つ宣伝をさせてください。

SansanのDSOC R&Dグループでは、類まれなデータベースを新たな価値につなげるべく、機械学習、画像処理、データ分析を専攻する学生の方々を募集しております。

この記事などでも紹介させていただいたように、国内はもちろん世界的に見ても優秀なメンバーが研究開発者として在籍しています。そんなメンバーに囲まれ、量、質ともにユニークなデータを相手に自身の手腕をふるってみませんか。

ご応募、ご連絡はこちらまで。

text: 人事部 伊東敏(びん)

Pickup