こんばんは。R&D糟谷です。
ソフトウェアの世界ではなるべくありものを使って車輪の再発明をしないという方針が一般的です。
一方で、世の中のR&Dでは自分たちで一から作ることで、
他社に真似出来ないすごいものを作ろうという考えも根強いように思います。
このあたりはバランスですが、
Sansan株式会社のR&Dではどちらかと言うと積極的にありものを使っていこうという考えです。
例えば、文字認識などは、日本語の全文字を認識しなければいけないため、
ゼロから作ると大変なことになります。
メンテやアップデートのために常に人を張り付かせて置かなければなりません。
大企業ではないのでそのようなリソースはないため、
車輪の再発明は避け、オープンソース商用ソフトウェアを積極的に活用しています。
例えば、こちらのプレスリリースにあるようにドコモの画像処理技術も活用しています。
https://www.nttdocomo.co.jp/info/news_release/notice/2016/05/25_00.html
文字認識や画像処理など、汎用的な処理はライブラリを使用することは多いですが、
それでも、自社が扱っているデータの特殊性から研究課題は多数存在します。
また、それらと向き合う中で、汎用的な処理においても
一般的なレベルを超えているライブラリもいくつかあります。
今は公開などはしていませんが、そのうち世の中に還元していけたらと思います。