データサイエンスでできること

今回の記事では「化学系のデータサイエンスでこんなことができる」というお話をできればと思う。

「データサイエンスでできること」を一言で言うと、「数式(関係式)の形で表現できる」ようになることかなと思う。

例えば、研究者が実験する際に、「この配合にすれば性能が向上するだろう」という予測はできるが、「この配合にすれば性能が5%向上するだろう」などのような定量的な予測は一般的に困難である。

一方で、データサイエンスにより数式の形で表現できていれば、「この配合にすれば5%向上するだろう」と定量的な予測ができるようになる。企業での研究開発では、ほとんどの場合において目標数値が設定されているため、定量的な予測ができる、すなわち「データサイエンスにより数式の形で表現すること」は非常に意義があると思う。

また、どの企業においても特定の分野でビジネスを長年やっていれば、その分野の独自のデータ(ノウハウ)が蓄積されていると思うが、ノウハウを皆に伝える技術伝承は時間・コストが非常にかかるな〜と感じる。ノウハウを持っている人(職人みたいなイメージ)の経験・勘が言語化されていなかったり、何よりノウハウを「伝える」ということがそもそも難しいと感じる

一方で例えば、水溶解度の大きい化合物を作っている会社であれば、「この化合物の水溶解度はこれくらい」という独自のデータを大量に持っていると思う。データサイエンスを活用して、下記のような「水溶解度」と「化合物の化学構造」の関係式を構築できれば、実験していない化学構造(水溶解度が未知の化学構造)を入力することで水溶解度を予測できるようになる。このような関係式を構築できれば、誰でも長年のノウハウを活用できるようになる。また下の関係式を使えば、水溶解度の小さい化合物も予測できるようになるため、ビジネス領域を拡大できるチャンスがででくる。

水溶解度 = F ( 化合物の化学構造 )

どんな分野でも条件を変えれば結果が変わるはずなので、今回のように予測したい項目(今回であれば水溶解度)と条件(今回であれば化合物の化学構造)が定義できるのであれば、基本的にどんな分野にでも適用できるのではないかなと思う。

今回の記事を通して「化学系のデータサイエンス」を学んでみたいと思える人がいれば非常に嬉しいです☺️

 

コメント

タイトルとURLをコピーしました