メニュー

論文記事:原死因確定作業についての実態・問題点の把握,ならびに正確・効率性向上に向けた機械学習の適用可能性と課題に関する調査研究 202003-04 | 一般財団法人厚生労働統計協会|国民衛生の動向、厚生労働統計情報を提供

m header btn

一般財団法人 厚生労働統計協会

サイトポリシープライバシーポリシー

pmark     お問い合わせ

論文

論文

第67巻第3号 2020年3月

原死因確定作業についての実態・問題点の把握,
ならびに正確・効率性向上に向けた機械学習の
適用可能性と課題に関する調査研究

今井 健(イマイ タケシ) 明神 大也(ミョウジン トモヤ) 大井川 仁美(オオイガワ ヒトミ)
香川 璃奈(カガワ リナ) 今村 知明(イマムラ トモアキ)

目的 人口動態調査は国勢調査と並ぶ国の主要統計で公衆衛生施策の中心的資料である。本研究ではこの中で死亡票に着目し,わが国における原死因確定作業の実態と問題点を明らかにすること,また,正確・効率性向上に向けた機械学習の適用可能性と課題について調査・検討を行うことを目的とした。

方法 まず,文献と厚生労働省担当者へのヒアリングを通じて,わが国における原死因確定プロセスの概要ならびに現状のオートコーディングシステムと人手確認作業の実態について調査を行った。次に,検証用に作成したダミーの死亡診断書ならびに原死因確定作業データを対象とし,諸外国で広く用いられているオートコーディングシステムIrisを用いた原死因確定作業の検証を行った。また,これらのプロセス分析結果を元に,正確・効率性向上のための機械学習の適用可能性について検討を行った。

結果 現行のオートコーディングシステムはルールに基づいた処理であること,同システムでICD-10コードが完全付与できないケースや付帯情報が含まれている場合については人手での目視確認による原死因確定作業が行われ,月約10万件の死亡票データのうち,約4割を占めていることが判明した。また死亡票ダミーデータを用いた分析から,特に付帯情報は最終原死因コードの確定に大きく影響を及ぼし得ることが判明した。原死因確定作業のさらなる高精度化と効率化のための機械学習の適用については,①Ⅰ欄Ⅱ欄傷病名に対するICD-10コーディングや②ICD-10コードの組み合わせからの選択ルールに基づいた仮原死因確定作業については,機械学習の適用が困難,あるいはメリットが大きくない一方で,③付帯情報を考慮した最終的な原死因確定プロセスについては,機械学習適用のメリットが大きいことが判明した。また,機械学習の適用シナリオとしては,「プロセス全体に対する適用」と「プロセス分解による部分的適用」の2つが考えられたが,後者は前者に比べて大幅な精度向上が期待できると共に,付帯情報の影響に特化して学習できる点からより適していると考えられた。

結論 今後,わが国の原死因確定プロセスに対し,上記のシナリオに準じ機械学習を部分適用することによって,現状の月約4万件に及ぶ人手確認作業の大幅な効率化と高精度化が期待できると考えられた。

キーワード 人口動態調査,死亡票,原死因確定プロセス,ICD-10,機械学習

ronbunnetshop