ビジネスジャーナル > ITニュース > 業務効率1000倍になるDX活用術
NEW
野村直之「AIなんか怖くない!」

人間が見やすいExcelの作成は、もうやめよう…業務効率が1000倍になるDX活用術

文=野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員
人間が見やすいExcelの作成は、もうやめよう…業務効率が1000倍になるDX活用術の画像1
「Getty Images」より

 前回までに、シンギュラリティは、SFやエンタメとして話すなら良いけれど、国家や自治体、法人の事業計画に反映などさせてはいけませんよ! と議論してまいりました。10月下旬のAI Expoにて、人工知能学会会長が講演した際のご意見がほぼ同じで、「SFですね(事実であるかのように信じちゃいけない)」と明言されたので、一旦打ち切ります。

 GAFAがAIサービスを独占しかねない、データや高速計算サービスの囲い込みを含むニューモノポリー(new monopoly)についてもいろいろ書きました。ここへきて、アメリカのバイデン大統領の民主党政権がさまざまなGAFA規制に前向きとの情報を得ました。そこで、GAFA規制の方針が打ち出され、行く末がある程度見えてきた時点で改めて取り上げたいと思います。

 これらよりも、現在取り上げたい話題は、日本国内で急速に盛り上がってきたDX(Digital Transformation:デジタル・トランスフォーメーション)です。AIと同様に、いや、それ以上に多彩な意味で使われ、間違った方向に行きかけているきらいも感じます。良いデジタル化と悪いデジタル化がある。すなわち、ただデジタルであるだけではいけない、というあたり、正確で有用な議論の素材を提供することが急務です。

文書の承認フロー改良、悲喜こもごも

 コロナ直前のニュースに、ハンコ押しロボットというものがありました。100%アナログ、人間と人間の連携プレーで承認業務が行われていた業務フローのほんの一部を、デジタル制御のロボットで代替するという、RPAに似た発想です。AIやさまざまなパワフルなIT、機械技術を導入するなら、その部分だけ何百倍ものスピード、365日24時間休みなく進められてけた違いの処理量をこなせるわけですから、本来、業務フローを機械前提に1から見直し、ゼロから再設計すべきです。この例でいえば、真っ先に、改ざん不能な帳票を安全にやりとりできるブロックチェーンで、100%デジタルデータによる高速、無形の承認フローを構築しようと考えるのが本来のDXでしょう。

 本連載『図らずもテレワーク普及で企業のデジタルトランスフォーメーションが一気に推進』でも書きましたが、Covid-19が企業の背中を蹴っ飛ばしてDXを加速し始めた今、テレワークを前提とした承認フローを考えない企業は競合に大きく遅れをとることが必定。そんな近未来を前提に、守旧的に、ある意味スムーズに、緩慢なデジタル化を進めることは許されなくなりつつあります。

 紙の文書でなく、PDFファイルを原本とする方向性を採用しても、いろんな実現の仕方があります。昨今では、「Word/Excelファイルをプリンターで印刷」→「押印」→「スキャナでスキャンして画像主体のPDFにして送付」→「紙の原本を郵送」という形で有印私文書のやり取りをしていたと思います。コロナ禍で、スピードが要求されるようになって紙の原本を不要としたり、「Word/ExcelファイルをPDF化し送付」で済ませるケースが出てきました。しかし、これを有印私文書扱いして、改ざんを犯罪として取り締まれるか怪しいところがあり、ブロックチェーン技術と、それを支える法整備が期待されるところです。

DXでは「人間に魅せる用Excel」はやめましょう! ~いずれはAPI連携へ

 本格的なDX、ビッグデータで機械学習させるようなDXなら、過去の大量データの再利用も必要となってきます。ワープロを「清書機」ととらえていた前世紀に作られた文書なら、電子ファイル自体が管理されず、なくなってしまっていたりします。

 また、あまりに古い形式、OS、アプリを必要とし、その製造社が消滅していて読みだせないこともあるでしょう。その場合、紙をスキャンして、OCR=文字認識させるにしても、高品質な図表入りの元ファイルを再現させるには、AIもまだまだ非力であり、認識誤りの修正などにかなりのコストがかかります。認識誤りが大勢に影響しない、頑健(robust)なテキスト分析ソフト(例えばAIポジショニングマップMr.DATA)を使うなりして、誤りの修正などやらないのが正しい戦略でしょう。

 なお、古い形式の電子ファイル(バイナリファイル)の場合は、xdoc2txt.exeという、国内の主要ソフトのほとんどどんなバイナリでも読み出せるフリーウェアがあります。日本語ワープロでは「一太郎」以前のヒット策「松」のファイルからテキストを読み出せるのでお奨めです。ExcelやPowerPointはうまくシートやページの仕切り線などもテキストデータで出力してくれます。 

 さて、今でも使われているMS Office互換のファイルであれば、十分合格なデジタルデータといえるでしょうか? いいえ、まったく違います。オフィス文書は、人間が、人間らしいやり方、スピードで作業するための形式、インタフェースを反映しています。使い方によっては、AIにとっては非常に扱いに困った代物になってしまうのです。

 次の図の左側の3種類のExcelデータを見てください。徹頭徹尾人間向けに、欄(セル)が結合されていたり、以下同様、と省略されていたり、表の中に小さな表があったりします。「省略されている内容は、上の行と同じに見えるじゃないか!」というのは人間が眺めるときの都合です。機械にとっては、同じ内容を引き継いでいいのか厳密に指定されないと、「わかりやすく」ありません。

人間が見やすいExcelの作成は、もうやめよう…業務効率が1000倍になるDX活用術の画像2

 そこで、右側のように、1行目に各欄の名称、定義を書いて、2行目以下は、金太郎飴のように、同一形式でデータ内容が出てくるデータにすることが求められます。保存するときは、コンマで区切られたCSV(Comma Separated Value)か、タブ・コードで区切られたTSV(TAB Separated Value)にするのが、さまざまなシステムとデータをやりとりするのに便利です。なお、上例右側のシンプルな、すっぴんの表(ひょう;table)の中身は、我がメタデータ社の誇る「ビール・オントロジー」の一部です。国内で売られているビール千数百種について、そのさまざまな属性情報を整備したものです。AIを活用して何らかの知識処理のようなことを行うには、このようにオントロジー(分野ごとの階層知識体系)を整備するのが肝となります。

「それでは人間にとって見にくい(醜い)ではないか?」との声には、「カード型データベースのように、各行を1枚のカードに奇麗に見やすく配置して閲覧、編集するフロントエンドをつければよいでしょう?」という回答があります。機械向けには、CSVや、TSVのままではなく、遠方にあるコンピュータが直接呼び出して処理できるように、API(Application Programming Interface)にします。

 それにより、丸ごと持っていかれてどう使われるかわからない危険な状態から、アクセス者が、そのアクセス権に従って必要な部分を必要なだけ検索・加工して取り出せるオンライン・データベースになります。ブラウザでも試しに呼び出すことはできますが、原則、プログラムがAPIを自動で呼び出します。企業と企業が互いにAPIを提供し合うことで、業務連携のスピードは100倍にも1000倍にもなります。

 日経BP 総合研究所 未来ラボ 上席研究員・谷島 宣之さんは記事、『「デジタル人材」を巡る人事部の誤解』の中で、「これから社会が変わっていく」という誤解を正すよう指摘しています。そう、社会のほうがとっくに変わっているのです。昔は、実験室からもってきた軍事用の製品が民生用よりはるかに優れていました。往時、米国の軍事規格MIL規格が圧倒的に最先端の技術水準(精度、速度、耐久性……)にあり、民生用は何年も後に、そのおこぼれにあずかる感じでした。しかし、コストゼロでコピーし、広められるソフトウェア、デジタルデータが支配する時代には、個人向け、一般消費者向けのほうが性能で先行しがちです。5万円のスマホに1億画素オーバーのカメラや高度なAI機能が搭載されたりと、枚挙にいとまがありません。

 古い情報システムをもった企業のほうこそ、一般人の個人生活、社会生活を激変させたITインフラをうまく取り込んで必死にキャッチアップしなければならない時代といえるでしょう。スマホを複数使い分ける煩雑さに大半の人は耐えられないから、BYOD(Bring your own device)と呼ぶ、個人スマホを会社業務に使う。

 しかし、悪しき公私混同による情報漏洩リスクも同時に抱え込むことになり得ます。良い公私混同で、プレッシャーなく、個人生活から創造的なアイディアを生み出すような社員を増やせたらどんなに良いでしょう。正しいDXを考えるとき、周辺や形から入るのではなく、デジタル人材をパワーアップするという中核から攻めるべきではないでしょうか。

野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員)

野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員)

AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員。


1962年生まれ。1984年、東京大学工学部卒業、2002年、理学博士号取得(九州大学)。NECC&C研究所、ジャストシステム、法政大学、リコー勤務をへて、法政大学大学院客員教授。2005年、メタデータ(株)を創業。ビッグデータ分析、ソーシャル活用、各種人工知能応用ソリューションを提供。この間、米マサチューセッツ工科大学(MIT)人工知能研究所客員研究員。MITでは、「人工知能の父」マービン・ミンスキーと一時期同室。同じくMITの言語学者、ノーム・チョムスキーとも議論。ディープラーニングを支えるイメージネット(ImageNet)の基礎となったワードネット(WordNet)の活用研究に携わり、日本の第5世代コンピュータ開発機構ICOTからスピン・オフした知識ベース開発にも参加。日々、様々なソフトウェア開発に従事するとともに、産業、生活、行政、教育など、幅広く社会にAIを活用する問題に深い関心を持つ。 著作など:WordNet: An Electronic Lexical Database,edited by Christiane D. Fellbaum, MIT Press, 1998.(共著)他


facebook
https://www.facebook.com/profile.php?id=100063550391719

人間が見やすいExcelの作成は、もうやめよう…業務効率が1000倍になるDX活用術のページです。ビジネスジャーナルは、IT、, , , の最新ニュースをビジネスパーソン向けにいち早くお届けします。ビジネスの本音に迫るならビジネスジャーナルへ!