mimi

Sansanの
人・組織・カルチャーを
伝えるメディア

Sansanの全プロダクトを支える。データ活用部門エンジニア

Sansanの仕事の中身がわかる連載企画「Inside Sansan」。今回はSansanが提供するプロダクトには必要不可欠な「ビジネスデータ」を正確にデータ化し、活用するデータ活用部門のエンジニア2名に話を聞きます。プロダクトを支えるデータ活用を担うエンジニアリングには、どんな特徴ややりがいがあるのでしょうか。まずはデータ化に向き合う小田のデスクからお届けします。

 

 

アナログ→デジタルの根幹を支えるワークフロー
Digitization部

技術本部 Digitization部 Bill One Entryグループ 小田崇之

Sansanに入社した理由と、このシステムに携わるようになった経緯を教えてください。

前職の会社に新卒入社した後、だんだんと「開発・運用がルーティン作業になっている」とか「サービスの規模が小さいので物足りない」と感じるようになり、転職を考えました。転職活動時はちょうど「Bill One」が急成長しているタイミングで、このアプリケーションへのデータ投入を担うBill One Entryグループに携わりたいと思い、Sansanへと入社しました。

Digitization部はどのような業務を担当されているのでしょうか。また、Sansanが事業を推進するうえで、この部署はどれくらい重要な役割を担っていますか。

「Sansan」「Bill One」「Contract One」といった各プロダクトから、画像やPDFなどのアナログデータのソースを受け取り、その内容から必要なデータを抽出・整理して納品しています。私たちが開発しているシステムは、アナログデータをデジタルデータに変換するためのワークフローシステムです。Digitization部はSansanの事業を支えるインフラであると自負しています。

「アナログ情報をデジタル化する」うえでは、具体的にどのような難しさや制約、面白さがあるのでしょうか。

データの流量は基本的に線形、ときには非線形に伸びていく中でQuality・Cost・Deliveryは一定であることを求められます。そのため常に、より高効率なシステムを模索していく必要があります。

データ化する対象によってもニーズや特性は変わります。まず「Sansan」で取り扱う名刺は、「Bill One」「Contract One」で扱う請求書や契約書と比較して圧倒的な流量であり、それを安定的にデータ化する事を求められます。

請求書は特に月初に多く受領する傾向が強く、さらにはデータ化の結果を使った作業をその月初に行いたいニーズがあるため、納期に対する要求はさらにシビアです。また、レイアウトも多様なため、自動化を難しくする要因となっています。

契約書においてはデータ化された内容を後で見返す性質上、精度へのニーズが他のサービスと比較して高いです。また、「前の契約内容から特定の項目をアップデートする」といった関連資料との紐付きが強いのも特徴です。

どのような瞬間に仕事の面白さを感じますか。

前述のようにQuality・Cost・Deliveryで評価されるからこそ、成果がわかりやすく数値として表れる瞬間は達成感があります。そして、自分たちの部署だけではなく研究開発部とも膝を突き合わせながら改善策を考えることは非常に面白いです。

このシステムを担当することで、習得できるスキルや身につく考え方などを教えてください。

個別の処理をつなげて最終的な結果を出す「ワークフローシステム」の構築を通して、後続処理へ影響を伝播させない設計や膨大な処理量に対して適切にスケーリングできる設計などの知見が身につきます。また、人によるオペレーションが混在することから、人によるミスの可能性を排除するための運用面も含めたシステム構築の経験も得られます。

Sansanの各プロダクトの根幹を支えるようなシステムだからこそ、システムに対して高い品質を求められますし、「止まってはいけない」という緊張感のなかでの設計・開発・運用の経験は他では得難いものだと思っています。

「Sansanに入社するとしたら、どのシステムを担当しようか迷っている」という人に向けて、メッセージをお願いします。

Digitization部には仮説を立てたうえでレバレッジの効く施策を実施・検証し、その成果を定量的に測定できる楽しさがあります。オペレーター・システム・自動化エンジンなどをひっくるめて「データ化システム」と捉えて施策を考えるため、扱う領域の幅は非常に広いです。プロダクトを支えるインフラとしての仕事に興味のある方は、ぜひDigitization部を検討してください。

求人情報:Webアプリ開発エンジニア[データ化] / Sansan株式会社

「価値のあるビジネスデータ」を創出する
データ戦略部門

技術本部 Sansan Engineering Unit Master Dataグループ 松本清紀

Sansanに入社した理由と、このシステムに携わるようになった経緯を教えてください。

Sansanのある取締役との最終面接で、彼が「日本有数の企業データベースを、自分たちの手で作りたい」というビジョンを語ってくれました。その思いに共感して入社し、データ戦略部ができるタイミングで私の入社理由を把握していたマネジャーに声をかけてもらいました。

データ戦略部門はどのような業務を担当されているのでしょうか。また、Sansanが事業を推進するうえで、この部署はどれくらい重要な役割を担っていますか。

ビジネスデータの収集とその利活用に関する一連の業務を担当しています。ビジネスデータとは、ビジネスを行う上であると便利、または必要不可欠なデータのことです。たとえば、会社概要や財務・業績、組織、役職者、人事異動、該当企業のニュースなどが挙げられ、こうしたデータを収集・統合して、顧客データを名寄せ・リッチ化しています。

名寄せを高精度に行うことで、競合他社では実現できない各種ビジネス情報の可視化を可能にしています。また、社内で使用する共通コード体系をデータ戦略部門が管理することで、Sansan全社のサービス間連携の要となる機能を提供しています。

複雑で膨大なビジネスデータを、収集・整理・データベース化して各プロダクトへ提供するうえでは、具体的にどのような難しさや制約、面白さがあるのでしょうか。

企業やその拠点を正しく判別して、識別子を割り振るというのは難しい作業です。日本だけでも、法人は600万社ほど存在しています。同じ名前の会社も世の中には多数あります。ありとあらゆる情報源を用いて、企業の名寄せを適切に行うための方法を考えなければなりません。また、エンジニアはご存じの方も多いと思うのですが、住所表記の正規化も非常に難易度が高く、チャレンジしがいのある課題です。

どのような瞬間に仕事の面白さを感じますか。

私たちが作っているシステムは、「この機能を実装できたら完了」という単純な性質のものではなく、むしろ機能が実装されてからがスタートです。その機能でいかにして顧客の要望を叶えていくか、どうすれば品質が向上したと言えるのかなど、考慮すべきことが多くわかりやすい正解がありません。その状況下で継続的に改善を行うことに面白さを感じます。

このシステムを担当することで、習得できるスキルや身につく考え方などを教えてください。

ビジネスデータに関する深い知識を習得でき、大規模なデータを扱う技術も学べます。また、データエンジニアリングとWebエンジニアリングのスキルもバランスよく身につきます。具体的には、データの分析・統合に関する技術はデータエンジニアリングの領域に、パフォーマンスを意識したAPI設計はWebエンジニアリングの領域に属し、そのどちらも担当します。

「Sansanに入社するとしたら、どのシステムを担当しようか迷っている」という人に向けて、メッセージをお願いします。

縁の下の力持ちとして、ビジネスデータを扱う私たちはすべての部門に影響を与えることができます。名寄せや住所に関する知識も深めることができるだけでなく、データエンジニアリングからWeb開発まで幅広く携われます。何よりも、企業合併や、企業名変更、移転などに代表される「現実世界の複雑さ」をエンジニアリングで解いていくという、難しくて面白い課題に取り組むことができます。

求人情報:Webアプリ開発エンジニア[データ戦略] / Sansan株式会社

 


カジュアル面談を実施しています

Sansan技術本部では中途・新卒採用向けにカジュアル面談を実施しています。Sansan技術本部での働き方、仕事の魅力について、現役エンジニアの視点からお話します。「実際に働く人の話を直接聞きたい」「どんな人が働いているのかを事前に知っておきたい」とお考えの方は、ぜひエントリーをご検討ください。

 

 

text&photo: mimi