2021年2月7日日曜日

Google AI文章要約で論文要約をしてみた

Googleの作った世界最高のAI文章要約 PEGASUSが公開されたのが、2020年の6月。

使ってみたいと思いつつも、発表当初はcodeだけで難しく断念していた。

次第に解説を含めたwebページも増えてきたので改めてtryしてみた

PEGASUS: A State-of-the-Art Model for Abstractive Text Summarization

こちらはpubmed用にも事前学習されており、人間が作った要約と同等の精度、という結果が出ているなんとも素晴らしいプログラム。

今回はこちらの論文を扱ってみた
*2021/2/5に出版された神経系論文の中で最も話題になっていたから選んだ

Patterns of Use and Discontinuation of Secondary Prevention Medications After Stroke

まずは、pubmed用に事前学習されたモデルで検討

abstructをそのまま入力して、出力されたのがこちら

['the aim of this study was to investigate whether certain patient acute care or primary care factors are associated with medication initiation and discontinuation in the community after stroke or with secondary prevention treatment within 1 year postdischarge .']

こちらを話題のDeepLに入れたのがこちら

"この研究の目的は、特定の患者の急性期ケアまたはプライマリーケアの要因が、脳卒中後の地域社会での投薬開始および中止、または退院後1年以内の二次予防治療と関連しているかどうかを調査することであった。"

文章が複雑だが、行間を読むとわからないわけではない、が、結構無理がある・・・


続いて要約に特化した事前学習を行ったものがこちら

['Prescription at hospital discharge, quarterly contact with a primary care physician, and prescription by a specialist physician are all inversely associated with antihypertensive discontinuation.']

DeepLで翻訳したものがこちら 

"退院時の処方、プライマリケア医との四半期ごとの接触、専門医による処方は、すべて降圧薬の中止と逆相関している'"

 これは、一見わかりにくいものの、論文の結論を適切に抽出している。


この論文の主旨としては以下と考えられる

脳卒中後1年後には内服薬が中止されている場合が多く、その因子としては①退院時に処方がある場合、②プライマリケア医との四半期ごとの接触している場合、③専門医に処方されている場合があげられる

まだまだ精度としては限界があるが、近い未来に、高度で複雑な医学論文も自動要約、自動翻訳でニュースが自動化される日もくるのであろう。



追記

記事にする上で、原著をそのまま引用すると著作権に抵触するので、言い換えが必要なのだが、それもこのPEGASUSモデルで作られている

上記論文のconlusion

Patterns of use of secondary prevention medications after stroke/TIA are not optimal, with many survivors discontinuing treatment within 1 year postdischarge. Improving postdischarge care for patients with stroke/TIA is needed to minimize unwarranted discontinuation.

こちらを言い換えた10の文章がこちら

['Improving postdischarge care for patients with stroke/TIA is needed to minimize unwarranted discontinuation.',

 'Improving postdischarge care for patients with stroke is needed to minimize unwarranted discontinuation.',

 'Improving postdischarge care for patients with stroke/TIA is necessary to minimize unwarranted discontinuation.',

 'The pattern of use of secondary prevention medications is not optimal with many survivors stopping treatment within a year after discharge.',

 'Postdischarge care for patients with stroke/TIA needs to be improved to minimize unwarranted discontinuation.',

 'The pattern of use of secondary prevention medications after stroke is not optimal with many survivors stopping treatment within a year after discharge.',

 'Improving postdischarge care for patients with stroke/TIA is needed.',

 'The pattern of use of secondary prevention medications after stroke is not optimal with many survivors stopping treatment within 1 year after discharge.',

 'Postdischarge care for patients with stroke/TIA needs to be improved.',

 'Improving postdischarge care for patients with stroke/TIA is needed to minimize unwarranted discontinuation']

これをDeepLで翻訳したのがこちら

[脳卒中/TIA患者の退院後のケアを改善することが、不当な中止を最小限に抑えるために必要とされている。

 '脳卒中/TIA患者の退院後のケアを改善することは、不当な中止を最小限に抑えるために必要である','

 脳卒中/TIA患者の退院後のケアを改善することは、不要な中止を最小限に抑えるために必要である','

 二次予防薬の使用パターンは最適ではなく、多くの生存者が退院後 1 年以内に治療を中止している。

 脳卒中/TIA患者の退院後のケアを改善し、不必要な中止を最小限に抑える必要がある。

 脳卒中後の二次予防薬の使用パターンは最適ではなく、多くの生存者が退院後 1 年以内に治療を中止している。

 脳卒中/TIA患者の退院後のケアを改善する必要がある。

 脳卒中後の二次予防薬の使用パターンは最適ではなく、多くの生存者が退院後1年以内に治療を中止している」、「脳卒中/TIA患者の退院後のケアの改善が必要である」。

 脳卒中/TIA 患者の退院後のケアを改善する必要がある。

 不当な中止を最小限に抑えるためには、脳卒中/TIA患者の退院後のケアを改善する必要がある』, 『脳卒中/TIA患者の退院後のケアを改善する必要がある]

この中で適切なタイトルを選ぶとすると

二次予防薬の使用パターンは最適ではなく、多くの生存者が退院後 1 年以内に治療を中止している。

簡便に言い換えができるので、良さそうな気もしてしまう