先日、以下の記事で「Googleドライブに画像をアップロードするだけで、順次OCR処理を行うApps Script」を紹介しました。
このスクリプト、Googleドキュメントの優れたOCR機能を利用しているので、かなり高精度に文字を認識してくれますが、やはり完璧な文章にはなりません。OCR処理において、誤認識された文字、余計なスペースや改行が入ってしまうことを避けるのは難しいでしょう。音声認識(音声入力)によるテキスト化についても、同様の問題があります。
こうした不完全な文章の修正作業は、得られるものが少ないわりに相当な時間がかかります。そこで使えるのが、近年登場したAIの活用です。この記事では、OpenAIのChatGPTを使って不完全な文章を読みやすく整える方法、さらに文体を変更する方法を紹介します。
ChatGPTで不完全な文章を読みやすく整える
ChatGPTは、文章の生成に優れたAIです。その能力を活かして、不完全な文章を読みやすく整えることが可能です。誤認識された文字の修正、余計なスペースや改行の削除、適切な句読点の挿入や段落の区切りといった作業を瞬時に行うことができます。これにより、OCRや音声認識の出力を自動的に整形し、手間を大幅に減らすことが可能になります。
以下は、ChatGPTに不完全な文章を読みやすく整えるよう依頼する例です。
以下は画像からOCRで認識した文章です。誤りと思われる部分を訂正し、余計なスペースや改行を除いて、読みやすく整形してもらえますか。
新規感染者数だけでなく、人院者 数や重疸者も増えてきている。新型コ口ナが「5類」
に変更されてから接触機合が増 えたこと、マスクの着月 率が下がったこと、自然感染
やワクチンによる免庄が時 間とともに下がってきた ことなどが理由だろうね。
ChatGPTの回答は以下の通りです。
以下が訂正後の文章です。
新規感染者数だけでなく、入院者数や重症者も増えてきている。新型コロナが「5波」に変更されてから接触機会が増えたこと、マスクの着用率が下がったこと、自然感染やチクワンによる免疫が時間とともに下がってきたことなどが理由だろうね。
「重疸者」「コ口ナ」「着月率」「免庄」「チクワン」などの誤りが訂正され、余分なスペースや改行は消されて読みやすくなりました。
ただし、「5類」が「5波」と誤って変更されてしまっています。ChatGPTは完璧ではないので、このようなミスをおかすこともありますが、それでも人間よりも遥かに早く、正確に文章を整えてくれます。もちろん、誤っている部分を指摘すれば、文章を出しなおしてくれます。
「5波」を「5類」に修正して、文章をもう一度出してください。
以下が訂正後の文章です。
新規感染者数だけでなく、入院者数や重症者も増えてきている。新型コロナが「5類」に変更されてから接触機会が増えたこと、マスクの着用率が下がったこと、自然感染やワクチンによる免疫が時間とともに下がってきたことなどが理由だろうね。
ChatGPTで話し言葉を丁寧で堅い文章に変換
ChatGPTを使えば、話し言葉を書籍や報告書に適した硬い文章に直すのも簡単です。通常、話し言葉と書き言葉は大きく異なる表現を用いるため、手動での変換には多大な労力と時間が必要となります。しかし、ChatGPTに任せれば瞬時に変換してくれます。
以下は、先ほど修正した文章を、続けて硬い文章に変換した例です。
書籍のように硬い文章に書き換えてください。
以下が訂正し、硬い文体に書き換えた文章です。
新規の感染者数に限らず、入院者の数や重症者の数も増加傾向にあります。これは、新型コロナウイルスの分類が「5類」へと変更された後に接触の機会が増大したこと、マスクの着用率が低下したこと、また自然による感染やワクチンによる免疫力が時間経過と共に低下してきたことなどが主な要因と考えられます。
まとめ
文章の誤りや文体を訂正する作業をChatGPTに任せることで、大幅な作業時間短縮が可能です。ChatGPTでも間違うことがあるので、人間による最終チェックは常に必要ですが、それでも人間より高速かつ正確に文章を整形したり、文体の変更を行ってくれるので、うまく活用すれば手動での校正や変換作業にかかるコストを大幅に節約することできるでしょう。
コメント