文系のトップである一橋大学の蓼沼宏一学長が、データサイエンスに関する新学部の創設に積極的である。「社会科学領域でも、近年、AIやビッグデータ等を活用したエビデンスに基づく政策立案や社会システムのデザイン、企業経営の革新などの重要性が飛躍的に高まっていることから、ソーシャル・データサイエンス分野を早急に強化・拡充し、学部を新設すること構想しています」と明言している。
同大は法・経済・商・社会学部を擁し、社会科学分野では長い伝統に培われた情報データが蓄積されている。それをデータサイエンスによって広く活用し、研究・教育の国際競争力の強化に結び付けたい、という狙いだ。
どちらかといえば、データ処理は情報科学系で数理処理が主体の理工系というイメージが強かった。しかし、日々蓄積されていくデータには人間社会にかかわる情報も多く、それを有用な目的で分析・判断するサイエンスが脚光を浴び始めたといえる。
3月上旬に開かれる予定だった、日経クロステック主催のデータサイエンティストに関するセミナーは新型コロナウイルスの影響で延期になったが、各企業のデータサイエンスの専門家が講演するプランで、ビジネスにおけるデータサイエンスの最前線を知る良い機会となったはずだ。
基調講演のテーマは「“文系”データ分析人財育成のススメ ~理系・文系の二本柱で会社を変える」というものだ。文系のデータサイエンスの専門家こそ養成すべき、という問題意識であろう。予定されていた講演者は、保険設計のデータサイエンスの活用に先進的な損害保険業界の専門家だった。一橋大のデータサイエンス新学部への期待も、これから急速に高まることは間違いない。
大学によって微妙に違うデータサイエンスの定義
現在、国立・公立・私立に1大学ずつ、データサイエンス学部がある。それぞれがデータサイエンスとは何かを自己定義しているので、そのまま紹介しよう。()内は既存の学部である。
まず、国立の滋賀大学(経済・教育)のデータサイエンス学部では、「社会に溢れているデータから《価値》を引き出す学問です。ICT(情報通信技術)の進化した現代では、あらゆるビジネスや医療、教育、行政などにおいても、高度なデータ処理能力、データ分析力が必要となっています。データから有益な《価値》を引き出すためには、これらの能力に加え、様々な分析経験を積むことが求められています」という。「分析経験」という言葉がキーワードになりそうだ。
次に、公立の横浜市立大学(医・国際教養・国際商・理)のデータサイエンス学部は事例を挙げており、より具体的だ。
「LIFE ネットショップで、欲しいものを予測――ネットショップの検索履歴から、ユーザーの消費動向を予測。『あなたにオススメの商品』を提案。SPORTS 試合に勝つ戦術をつくりだす――例えばサッカーでは試合開始から終了まで選手全員の動きと、ボールの軌跡を記録。選手の走行距離や累計時間などのデータを分析し、試合の戦術を作り出す。BUSINESS 混雑予測でレジ待ちをなくす――赤外線センサーを使い、来店者の行動から混雑するレジを予測。待ち時間がなくなるよう、レジ係の配置を操作する。HEALTH 一人ひとりに最適な治療法を割り出す――電子カルテの記録や画像診断データ等、蓄積する膨大な医療データを解析し、病気リスクの発見や難病治療に役立てる」
イメージはつかめるが、大学教育にふさわしい学問の体系性については、いまいちよくわからない。
私立の武蔵野大学(法・経済・文・教育・人間科学・工・グローバル・看護・薬・経営)の考えるデータサイエンスとなると、逆に抽象的だ。
「データを統計的に処理するだけではなく、AI(人工知能)技術を用いて大量のデータを共有、検索、統合することにより、物事の本質を見抜き、新たな知識を発見し、独創的アイデアで新たな価値を創造する学問です」
これら3大学のデータサイエンスの定義だけでは、どうも統一性に欠ける。
筑波大、山梨大、富山大はデータサイエンスを全学必修化
文部科学省は、文系・理系を問わずすべての大学生にAIやビッグデータ活用の知識を身につけてもらおうと、初級レベルの標準カリキュラム(科目)の策定を進めている。2019年6月に「AI戦略」を決め、25年の実現を目指して、毎年大学卒業生に初級レベルを習得してもらう。その半数はAIを用いて課題解決ができる「AI人材」として育成する、という。
特にAIを駆使できる人材は、アメリカや中国など世界各国で争奪戦となっている。経済産業省の試算では、30年にはAI人材は最大12.4万人が不足するからだ。それを受けて、筑波大学が先行して19年秋よりデータサイエンスを全学必修化、山梨大学と富山大学などは全学部でのデータサイエンスやAIの必修化を決めている。
AI戦略の予定コンセプトとして、デジタル社会における「読み・書き・そろばん」は「数理・データサイエンス・AI」であると想定。電卓を使いこなすように、日常生活や職場などでデータを使いこなせる基本的なスキルやノウハウを身につける、ということのようだ。たとえば、ある売店での売り上げ記録など実際のデータを使った演習では、帳簿やPCに集積されているデータをどのように初歩的な統計処理で分析するか、わかりやすく学ぶ。そうしたデータ活用事例の動画を使った授業もある。
そして、各大学の特色や学生のレベルに合わせて選択できるようにする。このカリキュラムの作成に携わった横浜市大の教員は、「これからの時代の『リベラルアーツ』(教養教育)とも言える」と指摘している。
リクナビ「内定辞退率」販売騒動の問題点
ただ、基本的なデータを扱う際に個人の尊厳を守るという基本的な倫理は大原則だ。19年に就職情報サイト「リクナビ」を運営する会社が就活学生の「内定辞退率」を本人の十分な同意なしに予測し、38社に有償で提供していた問題が発覚した。
なぜ、この内定辞退率というデータサイエンスの成果活用が問題なのか。個人情報保護法は、個人情報の外部提供に本人の同意取得を義務付けているからである。これは、最低限のモラルとして確立されなければならない
また、データサイエンスの限界を示唆するニュースもある。ロイターによると、アマゾンは採用活動にAIを用いて自動化する方法として、インターネットから情報を収集するシステムを開発した。ところが、膨大な履歴書データの大半が男性であったため、女性を除外する方向を打ち出した。データは過去のものであるため、人材採用にもっとも必要な将来の可能性を読み切れなかったようだ。
ここに、データサイエンスの限界があるといえるのではなかろうか。
(文=木村誠/教育ジャーナリスト)