Column連載コラム

2022.05.26

医療分野でのデータサイエンティストのお仕事の例

■はじめに

データサイエンスアカデミー兼任講師の元村です。

私は以前、医療ビッグデータを扱う某事業会社様にてデータサイエンス業務のご支援をしておりました。そこで今回は医療分野におけるデータサイエンティストの仕事について、その一例を説明していきます。

 

■レセプトについて

医療データと言っても様々な種類がありますが、私はレセプトデータの分析をしておりました。そこで「レセプト」について簡単に説明いたします。

日本という国は「国民皆保険制度」により、全国民が公的医療保険への加入を義務づけられております。医療保険に加入している事により、医療費の自己負担率は3割程度で済みます。残りの”7割程度”については医療保険から支払われますが、医療機関が保険者(=健康保険組合や市区町村など)に対してこの” 7割程度”を請求する際の明細書を「レセプト」と呼びます。

私がご支援させていただいた某事業会社様では、保険者様からレセプトデータをお預かりし、それを用いた様々なサービスを提供しております。その一環として、以下のページに掲載されているような資料を作成する業務に携わっておりました(こちらですが、執筆時点で「東京都 医療費 統計」と検索して一番上に出てきたものであり、実際に私が作成した資料ではありません)。

東京都福祉保健局 平成19年度 東京都医療費分析報告書

https://www.fukushihoken.metro.tokyo.lg.jp/iryo/kokuho/19iryouhi_bunseki.html

 

■分析に利用したツールについて

高度な分析を行う際はRを利用しておりましたが、主にSQL(Oracle)を利用して集計を実施しておりました。また分析業務だけでなく、報告書や図表の作成についても担当いたしました。図表は主にExcelを利用して作成し、報告書については指定されたフォーマットを利用いたしました(PowerPointやExcelなど)。

最も代表的な集計として、医療費集計があります。男女別、年代別、地域別、疾病別、などといった指標で集計をしていきます。地域別の集計については、GISツールを利用して集計結果を地図上にマッピングする、といった場合もありました。

また、健康診断のデータと突合させた上での分析もありました。「○○の既往歴があり、健康診断での△△の計測結果がこれくらいなので、健康リスクが高い」といった事を判定し、リスクが高い人を指導対象者として一覧表にまとめる、といった具合です。

個人的に印象に残っている集計として、薬剤関連の集計があります。薬剤の処方状況に関するデータから、ジェネリック医薬品の使用率はどれくらいか、併用禁忌薬を処方されていないか、残薬があるにも関わらず薬剤を処方されていないか、等について集計を行い、指導対象となるような服薬が疑われる人については一覧表に情報をまとめる、といった作業をしておりました。こういった集計のロジックを考える際には、医薬品に関するドメイン知識が必要になってきます。この業務に携わる前の私は医薬品に関してそこまで詳しいわけでは無かったので、過去の似たような分析を参照するなどして知識を身に着けておりました。

 

■実際にデータを扱ってみて

レセプトデータ分析に限った話ではないのですが、アカデミーのカリキュラムにもある「データ加工」が実務において大事になってきます。

レセプトの作成業務を実際に見た事は無いのですが、医療事務スタッフの方がコンピュータに入力して作成されているという話を過去に聞きました。手作業で入力していくとなると、データの入力ミスが発生する場合があります。

例として東京の地名を取り上げますと、「八王子」のような文字列が入力されている所に紛れて、漢字の「八」がカタカナの「ハ」に置き換わった「ハ王子」という文字列が入力されており、同じ名前として認識されない、といった事態が発生しておりました。

地名に関連してもう一つ例を説明します。こちらはミスでは無いのですが、「麴町」「麹町」のように、旧字体と新字体で表記が異なる場合があります。特に前者のような環境依存文字の場合、作業環境によっては「・町」と表示されてしまう場合もあります。

このように表記が異なる場合、そのまま集計してしまうと別な地名として扱われてしまいます。こういうデータを上手く扱うために、データの基礎俯瞰をしっかり行う、それを踏まえて適切なデータ加工を行う、等といった地道な努力が大事になってきます。

 

■おわりに

医療分野におけるデータサイエンティストのお仕事の例として、レセプトに関する知識から業務の概要まで簡単に説明しました。

今回説明した内容は地味に聞こえるかもしれませんが、こういう地道な作業の積み重ねがあってこそ、高度な分析において良い示唆を得る事が可能になってきます。非常にやりがいのある仕事ですので、データサイエンティストという職業に興味を持っていただければ嬉しいです。

 

■参考URL

医療事務のお仕事でよく聞く「レセプト」って何?

https://www.e-nichii.net/iryo/column/05548.html

医療保険制度の基礎知識

https://www.kenporen.com/health-insurance/m_knowledge/

データサイエンスアカデミーでは、
無料個別相談・セミナーを実施中!
お申し込みはこちら

Archiveアーカイブ