mimi

Sansanの
人・組織・カルチャーを
伝えるメディア

研究開発職

【Techの道も一歩から】第4回 「第16回情報科学技術フォーラム(FIT2017)で登壇」

こんにちは。DSOC R&Dグループの高橋寛治です。 Tech道を歩む中で避けられない一歩である「登壇」を第16回情報科学技術フォーラム(以下「FIT2017」)にて経験してきました。今回は、そのときの発表内容などをレポートしたいと思います。 情報科学技術フォー…

【どうして私がDSOCに?!】最終回「出会いを科学する」

こんにちは! 2017AWのコレクションから秋冬に何着るか考えたいのだけれども、2018SSのゴーシャラブチンスキー×バーバリーのルックがカッコよすぎて頭から離れない、DSOCの西田です。 連載最終回となる今回は、私がDSOCで取り組んでいるビジネスネットワーク…

【Techの道も一歩から】第3回「第11回テキストアナリティクス・シンポジウム」

こんにちは。Ctrlキーの押しすぎによる小指の痛みに悩んでいる、DSOC R&Dグループの高橋寛治です。 今回は、「第11回テキストアナリティクス・シンポジウム」に参加してきましたので、当日の様子を報告したいと思います。 テキストアナリティクス・シンポジ…

2週間の成果を最終発表!「R&Dインターンシップ」

こんにちは。人事部のびんです。 先日に公開した記事で紹介した各種インターンシップのうち、Data Strategy & Operation Center(DSOC)のR&Dグループによる2週間のインターンシップが先日に終了しました。 参加いただいた学生4名が、インターンシップ最終…

【R&D beans】番外編「インターンシップレポート(上京組)」

こんにちは! DSOCの大木です。 前回、R&Dグループでインターンシップを行っている学生の様子をレポートしました。 こちらでは、インターンシップの最後に行われる、成果発表直前の上京組の2名とそのメンターを務めるR&Dメンバーの様子をお伝えします! 今…

レコメンデーションエンジン漬けの1日「1dayインターンシップ(Eight事業部)」

こんにちは。人事部のびんです。 この夏、Sansanでは複数のインターンシップを実施しています。 今回は9月2日(土)に実施しました、Eight事業部Development Teamによる1dayインターンシップ「Sansan Tech Internship #レコメンデーション編」についてレポー…

【R&D beans】番外編「インターンシップレポート(関東組)」

こんにちは! DSOCの大木です。 R&Dグループでは、現在4名の学生がインターンに参加しています。 まずは関東の大学に通うお二人と、そのメンターのR&Dメンバーのランチに同席し、話を聞いてきました! 今回のゲスト インターン生 東京大学大学院 園田亜斗夢…

【Techの道も一歩から】第2回 「R&D論文読み会勉強会」

こんにちは。DSOC R&Dグループの高橋寛治です。 今回は、「R&D論文読み会」について紹介します。 「R&D論文読み会」とは この勉強会は、R&Dグループの有志が集まり、それぞれが読んだ論文について情報共有する場です。 R&Dグループは、画像処理、言語処理、…

この夏、Sansanでは複数のインターンシップを実施します!

こんにちは。人事部のびんです。 甲子園盛り上がりましたね! 埼玉県民の私としては、県勢初の夏の甲子園優勝はとても嬉しい限りです! さて、突然ですが高校球児に負けじと、この夏、Sansanはインターンシップというフィールドでアツく燃えています。 これ…

【R&D beans】第7回 サシランチ企画「『経済』は出会いや関係性で作られる」

こんにちは! DSOCの大木です。 お盆休みはどのように過ごされましたか? 私は朝の公共交通機関や歩道が信じられないくらい空いていて通勤しやすいなー! と思ってました。 休暇中の方が多いので、社内が広々として集中しやすいなー! とか。 適正な人口密度…

トップクラスの情報検索研究者が参加する「SIGIR2017」

こんにちは。DSOC R&Dグループの黒柳です。 先日開催された、「SIGIR」という国際学会に僕を含めたR&Dグループのメンバー3名が参加しました。僕自身は、同じくACM(Association for Computing Machinery)が主催する「SIGKDD(Special Interest Group on K…

【Techの道も一歩から】第1回 「言語処理100本ノック勉強会」

こんにちは。DSOC R&Dグループの高橋寛治です。 「新卒R&D研究員によるテックレポート」というテーマで、これから連載を担当することとなりました。 はじめに簡単な私の自己紹介をさせていただくと、大学・大学院では自然言語処理研究室で、自然言語処理の研…

【どうして私がDSOCに?!】第4回「特別編!師匠にインタビュー」

こんにちは! もうすぐ誕生日! 孫六食堂に行きたい! DSOCの西田です。 Sansanにジョインして2カ月が経ち、会社にも慣れてきて、具体的にどういうデータがあって、何を分析することが求められるのか、少しずつ分かってきました。 今は「リッチで面白いデー…

【R&D Beans】番外編 「最近R&Dメンバーが登壇した勉強会、その舞台裏」

こんにちは! DSOCの大木です。 誰しも「味覚の癖」ってあると思うのですが、わたしは好みが「すっぱい」に寄っています。 夏は四季の中でもすっぱいものがおいしい季節なので、とくにすっぱいものばかり食べてます。 「このすっぱいがうまい!」みたいなも…

研究開発者、データサイエンティストを目指す学生が全国から集結!「Kaggel Student Meetup」

こんにちは。先日、8月2日に誕生日を迎えました、人事部のびんです。 7月29日(土)、初の試みとして、機械学習、画像処理、データ分析を専攻する学生に向けたイベント「Kaggle Student Meetup by Sansan」を開催しました。 このイベントは、世界中のデータ…

【人事のつぶやき】Sansanの新卒社員について Part 1

こんにちは。 最近、体のことを考えてバックパック通勤に変えました。人事部のびんです。 突然ですが、2017年4月にSansanに入社したフレッシュな新卒11名をそれぞれ紹介したいと思います。 今回はその第一弾。独断と偏見(?)で選んだ、3名を紹介します(残…

【どうして私がDSOCに?!】第3回「Sansanとの出会い」

ハイサイ! 最近、ハマっているYoutuberはハイサイ探偵団! DSOCの西田です! 前回までは、いわゆる文系の私がビッグデータ分析に出会うまでを書きました。 今回はSansanにジョインするまでの経緯をお伝えします! Sansanとの出会い <就職後の迷い> 大学院…

【どうして私がDSOCに?!】第2回「ビッグデータ分析との出会い」

こんにちは! 最近、暑くて困りますね! DSOCの西田です! 今回は、ビッグデータ分析に取り組むことになったきっかけについてお話します。 ビッグデータ分析との出会い <運命の人との出会い> 大学院では「因果推論」の分析手法を学び、非正規労働者への教…

新連載【どうして私がDSOCに?!】第1回「データ分析との出会い」

◆ご挨拶 初めまして! DSOC R&Dグループの西田貴紀です。 この度、僭越ながら「どうして私がDSOCに?!」というタイトルで連載を担当することとなりました。 Data Strategy & Operation Center(略称:DSOC)とは、「Sansan」や「Eight」を通して取り込まれ…

【R&Dアーキテクト通信】 第19回 振り返り

こんにちは。DSOC R&Dグループの糟谷です。 以前、この連載でプロジェクトはクオーター単位で行うという話をしましたが、振り返りもクオーター(3か月)単位で行います。特に変わったことはしていなくて、KPTの形式です。 参考:KPTについて 意見を出しても…

【R&Dアーキテクト通信】 第18回 リモートとのコミュニケーション

こんにちは。DSOC R&Dグループの糟谷です。 Sansan株式会社のリモートのメンバーは4名で、京都と長岡にそれぞれ2人ずついます。 この他にも、会社の社内制度を利用すれば月4日まで在宅勤務ができるので、それを活用して自宅で働く人もいます。 そのため、…

【R&Dアーキテクト通信】 第17回 オペレーターさんに手伝ってもらう

こんにちは。DSOC R&D Groupの糟谷です。 一般的なR&Dでは学習データや評価などは「自分で行う」か、「外注して行う」かの2択だと思いますが、Sansanは自社で名刺入力のオペレーターさんを雇用しているので、その方々にそういった作業をお願いすることがで…

【R&Dアーキテクト通信】 第16回 自社開発するか、ありものを使うか

こんばんは。R&D糟谷です。 ソフトウェアの世界ではなるべくありものを使って車輪の再発明をしないという方針が一般的です。 一方で、世の中のR&Dでは自分たちで一から作ることで、 他社に真似出来ないすごいものを作ろうという考えも根強いように思います。…

2017年度 人工知能学会全国大会 に参加しました

こんにちは! DSOC R&Dの高橋寛治です。 先日開催された人工知能学会全国大会に参加してまいりました。 今回はその参加報告となります。 Sansanの学会参加 今回参加した人工知能学会とは、その名の通りの人工知能に関する学会です。 その中でも今回参加した…

【R&Dアーキテクト通信】 第15回 リリース後の性能評価

お久しぶりです。R&D糟谷です。 人工知能学会に参加したり、会社の期末に合わせたリリースに注力していて、 少し期間が空いてしまいました。 今回はリリース後の性能評価についてお伝えします。 R&DではリリースしたAPIの性能評価の一部も自分たちで担当し…

NII (国立情報学研究所)にデータを提供した背景について

こんにちは。DSOC大木です。 数ヶ月かけて調整してきた NII (国立情報学研究所)さんへのデータ提供が、ついに形になりました。 すでに NII さんからも弊社からもプレスリリースは出ているので こちらではデータ提供に至った背景と DSOC としての思いをお伝え…

【R&D beans】第2回 サシランチ企画 「取捨選択」

こんにちは!DSOC 大木です。 最近見かけた芸能人はブルゾンちえみです。 全身黒のロックテイストなコーディネートでした。 バックに男性はいなかったです。 さて、サシランチ企画の第2回目、始まるよ! ゲスト:水田さん 入社歴:2ヶ月 エニアグラム:タイ…

【R&Dアーキテクト通信】 第14回 開発グループとの連携

こんにちは!DSOC 大木です。 最近見かけた芸能人はブルゾンちえみです。 全身黒のロックテイストなコーディネートでした。 バックに男性はいなかったです。 さて、サシランチ企画の第2回目、始まるよ! ゲスト:水田さん 入社歴:2ヶ月 エニアグラム:タイ…

【R&D beans】第1回 サシランチ企画 「環境にこだわって働く」

こんにちは。4月から DSOC に join した大木と申します! DSOC (https://jp.corp-sansan.com/dsoc) の中で、数少ないエンジニアでも研究者でもない者です。 小さな頃から一貫して文系の人間で「技術的なこと」からはかなり遠い人生を送ってきましたが、この…

【R&Dアーキテクト通信】 第13回 プロトタイプ開発

こんにちは、連休も終わりましたね。R&Dの糟谷です。 今回はプロトタイプ開発についてです。 研究開発ではいきなりちゃんとしたものを作っても、精度が出なかったり、パフォーマンスが出なかったりすることがあります。 そこで、最初はプロトタイプを作って…

【R&Dアーキテクト通信】第12回 OCR(光学文字認識)サーバー

こんにちは、R&Dの糟谷です。 Sansanの名刺の入力には様々な工程があります。例えば、外部のオペレーターさんが名刺を入力するのに、氏名をバラバラにして個人情報が漏洩しないようにしています。 氏名をバラバラにするためには、画像のある部分が氏名だとわ…

【R&Dアーキテクト通信】第11回 設計レビュー

こんにちは。R&Dの糟谷です。今回は論文発表についてです。R&Dでは新しいAPIやライブラリを作る際には設計レビューを行います。このレビューもそんなに厳格なものではなく、アドバイスと理解が主目的となります。よっぽどのことがない限り、設計を直さないと…

【R&Dアーキテクト通信】第10回 論文発表するの?

こんばんは、R&Dの糟谷です。今回は論文発表についてです。 実は我々これまで論文発表はしていませんでした。理由は企業秘密で言えないことが多いことと、発表にかかるコストのわりにメリットが少ないことです。とはいえ絶対禁止ということはなく、成果を出…

【R&Dアーキテクト通信】第9回 新しいメンバーへの教育体制

少しご無沙汰してしまいました。糟谷です。今回は新しくR&Dに入った人への教育について書いてみます。 教育といってもR&Dの場合、新卒であっても基本的には研究経験者で即戦力ですので、「機械学習とは」、とか「画像処理とは」みたいな教育をすることはあり…

【R&Dアーキテクト通信】第8回 NuGet化

こんにちは、DSOCの糟谷です。今回はちょっと専門的な話になります。 R&Dでは.NET FrameworkのC#環境で開発することが多いという話を書きましたが、.NETにはNuGetというパッケージ管理システムがあり、それを活用しています。社内NuGetサーバーを立て、社内…

【R&Dアーキテクト通信】第7回 プロジェクトの進め方

こんばんは、R&Dの糟谷です。 Sansan株式会社の名刺のデータ化、活用を担う部署DSOC(Data Strategy & Operation Center)ではプロジェクトチームで行う業務と普段の業務の2種類があります プロジェクトチームで行う業務は基本的にはクオーター(3か月)単位…

【R&Dアーキテクト通信】第6回 R&Dのソースコードレビュー

こんにちは。週に1度更新しているR&Dアーキテクト通信。今回で第6回です。 今日は、R&Dのソースコードレビューについてお話しします。 R&Dではソースコードは主にC#、その他いろいろな言語で書きますが、C#での開発ではResharper(R#)というツールを活用して…

【R&Dアーキテクト通信】第5回 R&Dのチーム構成

こんにちは、糟谷です。今回はR&Dのチーム構成について話したいと思います。 Sansan株式会社のデータ化・活用を担う部署DSOC(Data Strategy and Operation Center)のメンバーは30名程度、開発グループ、運用、R&Dそれぞれ10名ずつぐらいです。 開発グループ…

【R&Dアーキテクト通信】第4回 R&DのCI

Dsocの糟谷です。 今回はR&DのCI環境について話したいと思います。他社の開発とあまり変わらないかもしれませんがR&Dとしては多少進んでいるのではないでしょうか。 ソースコード管理はGitHub上で行い、プルリクエストベースで開発を進めています。プルリク…

【R&Dアーキテクト通信】 第3回 R&Dはどこまでやるの?

今回はR&Dの役割分担について話したいと思います。 Sansan株式会社の基本方針は、「R&DはライブラリをAPIとして提供してその運用まですべて自分たちで行う」です。 他社のR&Dですと、 ・アルゴリズムの設計をMATLABなどで行って組み込むのは事業部 ・DllやLi…

【R&Dアーキテクト通信】 第2回 言語やOSの選定について

今回は言語やOSの選定などについて話したいと思います。 Sansan株式会社の歴史的な経緯から、C#のプログラムををVisual Studio上で開発し、WebApiとしてWindows Serverにデプロイするというのが最も基本的な開発スタイルとなっています。他のシステムやAWSの…

【R&Dアーキテクト通信】 第1回 R&Dアーキテクトとは

こんにちは、Data Strategy & Operation Center R&Dアーキテクトの糟谷です。チーフアーキテクトの島に代わってR&Dの開発体制や方針などを紹介していきます。 ■Data Strategy & Operation Centerとは 『Sansan』と『Eight』が提供する価値は、ユーザがスキャ…