マイブログ リスト

医療言語処理講座

2012年9月2日日曜日

コンピュータサイエンスからデータサイエンスへ、そしてビックデータサイエンスへ

 先月828日から3日間「Cloud Week 2012@北海道大学 ~クラウド技術の最先端を探る~」が開催され、夏休み時期でもあり自主研修で参加しました。


 主催者である北海道大学情報基盤センター長の高井 昌彰氏の挨拶の中で、今は“コンピュータサイエンス”の時代から“データサイエンス”の時代に変化しているとありました。


コンピュータサイエンスはなじみが深い言葉で、日本語では計算機科学となるわけですね。


Wikiによればその範囲は、C.シャノンの情報理論やA.チューリングのチューリングマシンなど基礎理論からプログラミング言語、分散コンピューティングや並列コンピューティング、コンピュータの土台であるオペレーティングシステム、社会インフラであるコンピュータネットワーク、セキュリティに欠かせない暗号理論、大量のデータを扱うためのデータベース技術、そして私たちの仕事や生活を支援する人工知能技術や抽象的な問題を可視化するコンピュータグラフィックスなど、その応用範囲は広いです[1]


一方、データサイエンスは“コンピュータでデータを扱って、人間の役に立つようにする分野”と定義しています[2]


一言でいえば“データマイニング”がデータサイエンスの核ですね。その対象分野はコンピュータサイエンスとも重なりますが、データ化、データベースなどデータそのものを対象して、統計学的なデータ分析の手法、そのデータをもとに思考する人工知能技術やデータをもとにシュミレーションする技術などが含まれます。


こうしてみると明らかに社会(時代)はデータサイエンスに向かっているように思います。


現在、インターネット上に様々な情報が存在し、医療機関の情報システムの中にも大量の情報が詰まっています。これをうまく利用して新しい医療の時代が現れると思います。


時代はデータサイエンスからビックデータサイエンスに進んでいる・・・


ビッグデータサイエンスが対象とする分野は、従来の分野に加えて自由記述文書からトピックの抽出や知識世界を俯瞰するオントロジーやトピックマップが加わっていくのではないでしょうか。




参考URL
[1]http://ja.wikipedia.org/wiki/%E8%A8%88%E7%AE%97%E6%A9%9F%E7%A7%91%E5%AD%A6
[2]http://heartland.geocities.jp/ecodata222/ed/edj1.html