1. 日本新聞協会トップページ
  2. すべてのヘッドライン
  3. 横断検索実現に注目 地方紙デジタル化で研究者 東大院シンポ

横断検索実現に注目 地方紙デジタル化で研究者 東大院シンポ

 東大院情報学環は7月13日、地方紙の過去の紙面のデジタル化をテーマにしたシンポジウムを新聞協会会議室で開いた。各紙を横断検索できるデータベースの構築を求める声が研究者から上がった。

 情報学環は今年2~4月に新聞協会と共同で、過去の紙面のデジタル化について現況を調査した。地方紙47社が回答した。紙面のスキャニングは進んでいるものの、記事のテキストデータ化は広がっていないことが分かった。

 東大院の吉見俊哉教授は、過去の地方紙記事は学術研究資料として価値が高いと指摘した。昭和天皇の全国巡幸を地元紙が詳細に報じたことを例に「地方紙を横断的に検索できれば、新たな事実が分かり、歴史が塗り替わる可能性もある」と述べた。専修大の植村八潮教授もアーカイブが充実し、学生が各地の新聞に触れる機会が増えれば「地方の視点を身に付ける機会が増える」と期待を寄せた。

 自然言語処理を研究する東大の美馬秀樹准教授は「人工知能(AI)の研究には質の高いデータが欠かせない」と指摘。AIに学習させるデータとして新聞記事は魅力的で、記事のテキストデータ化の進展に注目していると語った。

 スキャンした紙面から文字を拾い出す光学文字認識(OCR)技術も進んでいるものの、テキストデータ化には人手も時間も要する。参加者からはアーカイブ拡充の採算性を考えると難しいとの声も上がった。

 新聞社のデータベース担当者ら43人が参加した。

ページの先頭へ