データジャーナリズムの現在地

投稿者: 加藤 淳
投稿日:
カテゴリ: research, science, discussion

情報処理学会の学会誌「情報処理」5 月号の巻頭コラムは NHK 解説委員 三輪 誠司氏の「報道の現場を変えたプログラミングスキル」でした。三輪さんのことはNHK 取材ノートで知り、この巻頭コラムも興味深く読ませていただきました。

三輪さんが「業務改善ツール」として取り組まれているもののうち、データをプログラムで処理してニュースに活用する手法は、広くデータジャーナリズム(data journalism)と呼称されているものだと思います。私の専門であるプログラミング体験(programming experience)の研究者のなかには、データジャーナリズムに使えそうな、データ処理に特化したライブラリや開発環境を作っている人たちがいます。かくいう自分も画像処理パイプラインをインタラクティブに作れる開発環境を作りました。

福地さん、坂本さんとの雑談のなかで、データジャーナリズムに関する最新情報が日本語であまりまとまって出てこないことに気づきましたので、素人目線ですが、ちょっと調べて分かったことをこの記事でまとめておこうと思います。(事実誤認や抜け漏れがありましたらお知らせください!

2010 年代

2010 年代は、オープンデータのうねりと共に、日本である程度データジャーナリズムという言葉が知られるようになった頃のようです。メディア企業がイベントを開いたり、英語資料の邦訳プロジェクトが走ったりしていました。

2014 年には朝日新聞が「デジタルジャーナリズム」と題した特設ページを開設し、 MIT と共同シンポジウムを開いています。ただ、デジタルジャーナリズムのページの更新は同年で止まっていて、その後の組織的な取り組みには繋がっていないように見えます。

データジャーナリズム黎明期から事例研究や普及活動を進めていた赤倉 優蔵さんという方がいらっしゃるのですが、おそらくこの方を中心に運営されていた「ジャーナリズム・イノベーション・アワード」が 2017 年で止まっています。

また、Data Journalism Handbook という、おそらく界隈では有名な本の日本語訳プロジェクトがあるのですが、 2016 年に更新が止まっていて、原著の改訂版には追従できていないようです。

2020 年代

2020 年代に入ってからは、2010 年代終盤にかけていったんは静まったデータジャーナリズムのうねりが、また別のところで、散発的ではありますが大きくなってきているように見えます。

例えば、2020 年の元旦には「『データジャーナリズム元年』への期待と懸念」という記事が掲載されています。同年 2 月には東洋経済オンラインで新型コロナウィルスのインタラクティブなビジュアライゼーション記事が有名になり、グッドデザイン賞を獲得しました。制作の経緯は取材記事によくまとまっています。

このビジュアライゼーションの作者である荻原 和樹さんは、今はスマートニュースのメディア研究所に勤めてらっしゃるようです。

荻原さんが 2020 年末に書かれた「なぜデータジャーナリズムは日本で普及しないのか」という記事は、三輪さんの課題感を違う角度から捉えたものに見えて、大変興味深かったです。 例えば「開発者を書き手として扱おう」というあたりは、私の目指す世界観とも近いもので共感しました。

ちょうど 2021 年末には、朝日新聞で元エンジニアの山崎 啓介さんが記事を作成、執筆した事例の解説「データジャーナリズムの種明かしするよ(衆院選の争点分析)」が Qiita に掲載されました。これは、荻原さんの記事への回答にもなっていますね。

アカデミアの取り組み

アカデミアでは、データジャーナリズムに関する研究が散発的に行われています。(専門にしている研究室は寡聞にして知りません…もしあれば、教えていただけると嬉しいです。)

自然言語処理(Natural Language Processing; NLP)を専門としている岡崎 直観さんが 2016 年に解説記事を書かれています。

2019 年には、Ubiquitous Computing (UbiComp) を専門としている東大 越塚研がオープンデータつながりで日経と共同研究を始めたようです。人文科学系での研究事例はさらに数が少ないようですが、法政大 藤代研は NTT 基礎研と共同研究したりしています。

データジャーナリズムのためのツール

日本ではあまり見ないのですが、海外に目を向けると、ジャーナリストが実践的に使えるプログラミング環境やソフトウェアツールを作るような研究もあります。Human-Computer Interaction、データ可視化、プログラミング言語などの研究分野で横断的に取り組まれています。

データ可視化ライブラリで有名な D3.js は University of Washington の Jeff Heer のラボ Interactive Data Lab で生まれましたが、同ラボはその後も Vega やその応用研究 Idyll など、論文も出しながら積極的にデータジャーナリズムを支援しています。

ジャーナリズムとは距離を置いているようですが、Microsoft Research の Bongshin Lee たちが積極的に ツール開発をしている Data-driven Storytelling も関連が深い研究テーマですね。

変わり種では、プログラミング言語系の研究者 Tomas Petricek が、 Alan Turing Institute でポスドクをしていた間に、 Gamma というシンプルなデータジャーナリズム用言語を作っていました。

最後に

私はかねてから、メインストリームのプログラミング言語やプログラミング環境は汎用的すぎると考え、開発したいアプリケーションごとに適したユーザインタフェースを設計し、ドメイン特化の言語や環境を作ってきました。プログラミング教育については横目で見つつ自分で直接研究したことはないのですが、誰もがプログラミングを学ぶご時世だからこそ、学び方にもバリエーションがあったほうがよいのではないかと感じます。

データジャーナリズムに関しても

  • そもそもデータジャーナリズム用のプログラミングツールが貧弱である(あるいは、いいものがあるが知られていない)
  • 汎用のプログラミング教育はデータジャーナリズムへの最短パスになっていない

という二段階の課題があるような気がします。

今すぐに研究できる余力があるわけでは(たぶん)ないのですが、今後も業界ウォッチを続けたいと思います。

日本語 文献リスト