研究開発職
こんにちは! 2017AWのコレクションから秋冬に何着るか考えたいのだけれども、2018SSのゴーシャラブチンスキー×バーバリーのルックがカッコよすぎて頭から離れない、DSOCの西田です。 連載最終回となる今回は、私がDSOCで取り組んでいるビジネスネットワーク…
こんにちは。Ctrlキーの押しすぎによる小指の痛みに悩んでいる、DSOC R&Dグループの高橋寛治です。 今回は、「第11回テキストアナリティクス・シンポジウム」に参加してきましたので、当日の様子を報告したいと思います。 テキストアナリティクス・シンポジ…
こんにちは。人事部のびんです。 先日に公開した記事で紹介した各種インターンシップのうち、Data Strategy & Operation Center(DSOC)のR&Dグループによる2週間のインターンシップが先日に終了しました。 参加いただいた学生4名が、インターンシップ最終…
こんにちは! DSOCの大木です。 前回、R&Dグループでインターンシップを行っている学生の様子をレポートしました。 こちらでは、インターンシップの最後に行われる、成果発表直前の上京組の2名とそのメンターを務めるR&Dメンバーの様子をお伝えします! 今…
こんにちは。人事部のびんです。 この夏、Sansanでは複数のインターンシップを実施しています。 今回は9月2日(土)に実施しました、Eight事業部Development Teamによる1dayインターンシップ「Sansan Tech Internship #レコメンデーション編」についてレポー…
こんにちは! DSOCの大木です。 R&Dグループでは、現在4名の学生がインターンに参加しています。 まずは関東の大学に通うお二人と、そのメンターのR&Dメンバーのランチに同席し、話を聞いてきました! 今回のゲスト インターン生 東京大学大学院 園田亜斗夢…
こんにちは。DSOC R&Dグループの高橋寛治です。 今回は、「R&D論文読み会」について紹介します。 「R&D論文読み会」とは この勉強会は、R&Dグループの有志が集まり、それぞれが読んだ論文について情報共有する場です。 R&Dグループは、画像処理、言語処理、…
こんにちは。人事部のびんです。 甲子園盛り上がりましたね! 埼玉県民の私としては、県勢初の夏の甲子園優勝はとても嬉しい限りです! さて、突然ですが高校球児に負けじと、この夏、Sansanはインターンシップというフィールドでアツく燃えています。 これ…
こんにちは! DSOCの大木です。 お盆休みはどのように過ごされましたか? 私は朝の公共交通機関や歩道が信じられないくらい空いていて通勤しやすいなー! と思ってました。 休暇中の方が多いので、社内が広々として集中しやすいなー! とか。 適正な人口密度…
こんにちは。DSOC R&Dグループの黒柳です。 先日開催された、「SIGIR」という国際学会に僕を含めたR&Dグループのメンバー3名が参加しました。僕自身は、同じくACM(Association for Computing Machinery)が主催する「SIGKDD(Special Interest Group on K…
こんにちは。DSOC R&Dグループの高橋寛治です。 「新卒R&D研究員によるテックレポート」というテーマで、これから連載を担当することとなりました。 はじめに簡単な私の自己紹介をさせていただくと、大学・大学院では自然言語処理研究室で、自然言語処理の研…
こんにちは! もうすぐ誕生日! 孫六食堂に行きたい! DSOCの西田です。 Sansanにジョインして2カ月が経ち、会社にも慣れてきて、具体的にどういうデータがあって、何を分析することが求められるのか、少しずつ分かってきました。 今は「リッチで面白いデー…
こんにちは! DSOCの大木です。 誰しも「味覚の癖」ってあると思うのですが、わたしは好みが「すっぱい」に寄っています。 夏は四季の中でもすっぱいものがおいしい季節なので、とくにすっぱいものばかり食べてます。 「このすっぱいがうまい!」みたいなも…
こんにちは。先日、8月2日に誕生日を迎えました、人事部のびんです。 7月29日(土)、初の試みとして、機械学習、画像処理、データ分析を専攻する学生に向けたイベント「Kaggle Student Meetup by Sansan」を開催しました。 このイベントは、世界中のデータ…
こんにちは。 最近、体のことを考えてバックパック通勤に変えました。人事部のびんです。 突然ですが、2017年4月にSansanに入社したフレッシュな新卒11名をそれぞれ紹介したいと思います。 今回はその第一弾。独断と偏見(?)で選んだ、3名を紹介します(残…
ハイサイ! 最近、ハマっているYoutuberはハイサイ探偵団! DSOCの西田です! 前回までは、いわゆる文系の私がビッグデータ分析に出会うまでを書きました。 今回はSansanにジョインするまでの経緯をお伝えします! Sansanとの出会い <就職後の迷い> 大学院…
こんにちは! 最近、暑くて困りますね! DSOCの西田です! 今回は、ビッグデータ分析に取り組むことになったきっかけについてお話します。 ビッグデータ分析との出会い <運命の人との出会い> 大学院では「因果推論」の分析手法を学び、非正規労働者への教…
◆ご挨拶 初めまして! DSOC R&Dグループの西田貴紀です。 この度、僭越ながら「どうして私がDSOCに?!」というタイトルで連載を担当することとなりました。 Data Strategy & Operation Center(略称:DSOC)とは、「Sansan」や「Eight」を通して取り込まれ…
こんにちは。DSOC R&Dグループの糟谷です。 以前、この連載でプロジェクトはクオーター単位で行うという話をしましたが、振り返りもクオーター(3か月)単位で行います。特に変わったことはしていなくて、KPTの形式です。 参考:KPTについて 意見を出しても…
こんにちは。DSOC R&Dグループの糟谷です。 Sansan株式会社のリモートのメンバーは4名で、京都と長岡にそれぞれ2人ずついます。 この他にも、会社の社内制度を利用すれば月4日まで在宅勤務ができるので、それを活用して自宅で働く人もいます。 そのため、…
こんにちは。DSOC R&D Groupの糟谷です。 一般的なR&Dでは学習データや評価などは「自分で行う」か、「外注して行う」かの2択だと思いますが、Sansanは自社で名刺入力のオペレーターさんを雇用しているので、その方々にそういった作業をお願いすることがで…
こんばんは。R&D糟谷です。 ソフトウェアの世界ではなるべくありものを使って車輪の再発明をしないという方針が一般的です。 一方で、世の中のR&Dでは自分たちで一から作ることで、 他社に真似出来ないすごいものを作ろうという考えも根強いように思います。…
こんにちは! DSOC R&Dの高橋寛治です。 先日開催された人工知能学会全国大会に参加してまいりました。 今回はその参加報告となります。 Sansanの学会参加 今回参加した人工知能学会とは、その名の通りの人工知能に関する学会です。 その中でも今回参加した…
お久しぶりです。R&D糟谷です。 人工知能学会に参加したり、会社の期末に合わせたリリースに注力していて、 少し期間が空いてしまいました。 今回はリリース後の性能評価についてお伝えします。 R&DではリリースしたAPIの性能評価の一部も自分たちで担当し…
こんにちは。DSOC大木です。 数ヶ月かけて調整してきた NII (国立情報学研究所)さんへのデータ提供が、ついに形になりました。 すでに NII さんからも弊社からもプレスリリースは出ているので こちらではデータ提供に至った背景と DSOC としての思いをお伝え…
こんにちは!DSOC 大木です。 最近見かけた芸能人はブルゾンちえみです。 全身黒のロックテイストなコーディネートでした。 バックに男性はいなかったです。 さて、サシランチ企画の第2回目、始まるよ! ゲスト:水田さん 入社歴:2ヶ月 エニアグラム:タイ…
こんにちは!DSOC 大木です。 最近見かけた芸能人はブルゾンちえみです。 全身黒のロックテイストなコーディネートでした。 バックに男性はいなかったです。 さて、サシランチ企画の第2回目、始まるよ! ゲスト:水田さん 入社歴:2ヶ月 エニアグラム:タイ…
こんにちは。4月から DSOC に join した大木と申します! DSOC (https://jp.corp-sansan.com/dsoc) の中で、数少ないエンジニアでも研究者でもない者です。 小さな頃から一貫して文系の人間で「技術的なこと」からはかなり遠い人生を送ってきましたが、この…
こんにちは、連休も終わりましたね。R&Dの糟谷です。 今回はプロトタイプ開発についてです。 研究開発ではいきなりちゃんとしたものを作っても、精度が出なかったり、パフォーマンスが出なかったりすることがあります。 そこで、最初はプロトタイプを作って…
こんにちは、R&Dの糟谷です。 Sansanの名刺の入力には様々な工程があります。例えば、外部のオペレーターさんが名刺を入力するのに、氏名をバラバラにして個人情報が漏洩しないようにしています。 氏名をバラバラにするためには、画像のある部分が氏名だとわ…
こんにちは。R&Dの糟谷です。今回は論文発表についてです。R&Dでは新しいAPIやライブラリを作る際には設計レビューを行います。このレビューもそんなに厳格なものではなく、アドバイスと理解が主目的となります。よっぽどのことがない限り、設計を直さないと…
こんばんは、R&Dの糟谷です。今回は論文発表についてです。 実は我々これまで論文発表はしていませんでした。理由は企業秘密で言えないことが多いことと、発表にかかるコストのわりにメリットが少ないことです。とはいえ絶対禁止ということはなく、成果を出…
少しご無沙汰してしまいました。糟谷です。今回は新しくR&Dに入った人への教育について書いてみます。 教育といってもR&Dの場合、新卒であっても基本的には研究経験者で即戦力ですので、「機械学習とは」、とか「画像処理とは」みたいな教育をすることはあり…
こんにちは、DSOCの糟谷です。今回はちょっと専門的な話になります。 R&Dでは.NET FrameworkのC#環境で開発することが多いという話を書きましたが、.NETにはNuGetというパッケージ管理システムがあり、それを活用しています。社内NuGetサーバーを立て、社内…
こんばんは、R&Dの糟谷です。 Sansan株式会社の名刺のデータ化、活用を担う部署DSOC(Data Strategy & Operation Center)ではプロジェクトチームで行う業務と普段の業務の2種類があります プロジェクトチームで行う業務は基本的にはクオーター(3か月)単位…
こんにちは。週に1度更新しているR&Dアーキテクト通信。今回で第6回です。 今日は、R&Dのソースコードレビューについてお話しします。 R&Dではソースコードは主にC#、その他いろいろな言語で書きますが、C#での開発ではResharper(R#)というツールを活用して…
こんにちは、糟谷です。今回はR&Dのチーム構成について話したいと思います。 Sansan株式会社のデータ化・活用を担う部署DSOC(Data Strategy and Operation Center)のメンバーは30名程度、開発グループ、運用、R&Dそれぞれ10名ずつぐらいです。 開発グループ…
Dsocの糟谷です。 今回はR&DのCI環境について話したいと思います。他社の開発とあまり変わらないかもしれませんがR&Dとしては多少進んでいるのではないでしょうか。 ソースコード管理はGitHub上で行い、プルリクエストベースで開発を進めています。プルリク…
今回はR&Dの役割分担について話したいと思います。 Sansan株式会社の基本方針は、「R&DはライブラリをAPIとして提供してその運用まですべて自分たちで行う」です。 他社のR&Dですと、 ・アルゴリズムの設計をMATLABなどで行って組み込むのは事業部 ・DllやLi…
今回は言語やOSの選定などについて話したいと思います。 Sansan株式会社の歴史的な経緯から、C#のプログラムををVisual Studio上で開発し、WebApiとしてWindows Serverにデプロイするというのが最も基本的な開発スタイルとなっています。他のシステムやAWSの…
こんにちは、Data Strategy & Operation Center R&Dアーキテクトの糟谷です。チーフアーキテクトの島に代わってR&Dの開発体制や方針などを紹介していきます。 ■Data Strategy & Operation Centerとは 『Sansan』と『Eight』が提供する価値は、ユーザがスキャ…