最近、ChatGPTをはじめとする生成AI(文章や回答を自動で作るAI)を使ったサービスが急増しています。
質問に答えてくれるチャットボットや、社内の問い合わせに対応するAIなど、私たちの身近なところでも使われるようになりました。
こうした生成AIは、大企業だけでなく、中小企業や個人でも利用できるようになっています。
そのような状況の中、色々な分野で実際に生成AIを使用した発明が特許となるケースも増えています。
生成AI関連技術を研究開発しているみなさんも、自社技術(発明)が特許になるかもしれないと考えている方も多いのではないでしょうか?
生成AI関連技術は、新しい分野です。
しかも目に見えない技術であるため、特許になるかどうかの判断が非常に難しい分野でもあります。
この記事をご覧のみなさんも、「どのようなAI技術(発明)が特許になるのか」と興味をお持ちではないでしょうか。
そこで、今回はみずほ第一フィナンシャルテクノロジー株式会社の特許第7742475号「回答支援システム、回答支援方法及び回答支援プログラム」を挙げて生成AI関連の特許の内容をわかりやすく解説します。
技術の内容だけでなく、「なぜこの仕組みが特許になったのか?」も、やさしく解説しますので参考にしてください。
特許第7742475号の要約

今回取り上げる特許第7742475号は、「生成AIを用いて質問に対する回答を支援する『回答支援システム』」に関するものです。
質問応答サービスやチャットボットのような回答を生成してユーザーに示す製品やシステムにおいては、「回答の正確さ」と「ユーザーを極力待たせない」ことが重要です。
本特許においては、「回答の正確さ」と「ユーザーを待たせない迅速な処理」を両立させるために、生成AIそのものを改良するのではなく、生成AIに渡す「質問の与え方」を工夫しています。
本特許においては、以下のようにして質問を作成しています。
- 質問文に関連するテキスト配置データを取得する
- そのテキスト配置データを画像データとして生成する
- テキスト・テキスト配置データと画像情報を組み合わせて生成AIに入力する
つまり、質問そのものを示す文章だけでなく、「見た目(構造)」も生成AIに伝えるのが特徴です。
これにより、生成AIが質問の構造や背景を反映した処理を行いやすくなります。
その結果、より迅速な処理とより正確な回答の作成が可能となります。
請求項1の解説
特許第7742475号の請求項1を見てみましょう。
【請求項1】
生成AIに接続される制御部を備えた回答支援システムであって、
前記制御部が、
質問文及び前記質問文に関するテキスト配置データを取得する第1処理と、
前記テキスト配置データを画像化した画像データを取得する第2処理と、
前記質問文、前記テキスト配置データ及び前記画像データを前記生成AIに入力して回答を取得する第3処理と、を実行することを特徴とする回答支援システム。
この特許の特徴は、質問文が表のように複雑なデータ構造を有する情報である場合の処理速度を上げることです。
表データを生成AIに入力する際に、全てテキストデータとすると、冗長なデータとなります。
CSV形式やTSV形式のような表であると判断できるデータとして処理した場合でも、テキスト以外に特定の区切り文字も含むため、生成AIに入力されるデータは非常に冗長です。
また、生成AIが、表の構造を理解しにくいという点も問題です。
このような結果、生成AIに入力される情報が複雑になり、AI側の処理負担が大きくなってしまいます。
さらに、その結果として、生成AIが誤った回答をしてしまうという問題も発生してしまいます。
人間は表を見れば、「行と列の関係」「数値の対応関係」を一瞬で理解できます。
一方、生成AIも、テキストを含む表を画像として認識して処理することが可能です。
そこで、この発明では、生成AIも、画像として見せると「表の構造」を理解しやすいという点に着目しています。
つまり、「文章だけだと分かりにくい」が、「表を画像化すると分かりやすい」ことを利用して処理速度を向上させています。
ここで、この特許の請求項1を簡単にまとめてみましょう。
- 質問文を取得する(第1処理)
- 質問文に対応するテキスト配置データを取得する(第1処理)
- テキスト配置データに基づいて画像データを生成する(第2処理)
- 質問文・テキスト配置データ・画像データを生成AIに入力する(第3処理)
- 生成AIから回答を取得する(第3処理)
このように生成AIに画像として表のデータを渡すことで、処理速度の向上が期待できます。
さらには、生成AIに画像を基に表として認識させれば、生成AIが質問の構造や背景をより正確に把握でき、精度の高い回答を出力できます。
請求項1が解決しようとしている課題
この特許が解決しようとしている課題は、生成AIの利用時によく問題となる以下の点です。
- 生成AIに質問の意図が正しく伝わらない
- 生成AIに表や構造を誤解される
- 生成AIは情報量が多いと要点を外した回答になる
- 生成AIは情報量が多いと処理速度が遅くなる
生成AIは高性能であるものの、その回答精度や処理速度は、入力された情報の形式や整理状態に大きく依存します。
この特許では、 「生成AIそのもの」ではなく「入力情報」に着目して上記のような生成AIならではの課題を解決しています。
請求項1の構成要素の詳細
明細書も踏まえて、本特許のシステムにおける処理の流れを詳しく解説します。
処理フローの全体像
本特許における処理の流れは以下の通りです。
- 質問文の取得
- テキスト配置データの生成
- 第一プロンプトの生成
- 結果の確認と出力
- 画像データの生成
- 第二プロンプトの生成
- 結果の確認と出力
順番に解説します。
1.質問文の取得(取得部)
まずは、取得部でユーザーから入力された質問文(テキストデータ)を取得します。
この取得部では、表のような複雑なデータ構造を有するデータもテキストデータとして取得しています。
2.テキスト配置データの生成(生成部)
取得部で取得した質問文が表のような複雑なデータ構造を有するデータである場合は、このテキストデータを指定された表形式データに変換してテキスト配置データとして生成します。
3.第一プロンプトの生成(生成部)
テキストデータとテキスト配置データを含む生成AIのプロンプト(第一プロンプト)を生成します。
なお、プロンプトとは、生成AIに対して「何をしてほしいか」を伝える指示文や入力情報です。
4.結果の確認と出力(1回目)
生成AIにプロンプトを入力および実行させて、所定の結果が得られた場合は、結果を出力します。
これで処理は完了です。
5.画像データの生成(生成部)
上記の結果の確認(1回目)で、所定の結果が得られなかった場合は、生成部で上記テキスト配置データを視覚的に表現した画像データを生成します。
6.第二プロンプトの生成(生成部)
テキスト配置データと画像データを含む生成AIのプロンプト(第二プロンプト)を生成します。
7.結果の確認と出力(2回目)
第二プロンプトを生成AIに入力および実行させて、所定の結果を得て出力します。以上で一連の処理が完了します。
二段階プロンプトの考え方
本発明では、表などの複雑なデータ構造を有するデータを扱うことを前提としています。
テキストとテキスト配置データを含む第一プロンプトを用いて得た結果で所定の結果が得られない場合に、テキスト配置データと画像データを含む第二プロンプトを用いて結果を得ることが大きな特徴です。
つまり、本発明では、「まずは普通に文章でAIに質問する」→ 「うまく答えが出れば、それで終わり」です。
「うまくいかなかった場合」 → 「表の構造を画像にして、もう一度AIに質問する」としており、「テキストだけのシンプルな情報を入力 → 所定の結果を得られない場合は表の画像で補強した情報を入力」という流れで処理をしています。
生成AIが複雑なデータ構造を有するデータも画像として認識して処理することから、全てテキストデータとして入力した場合よりも処理速度の向上が期待できます。
また、本特許では、複雑なデータ構造を有するデータを画像として認識処理することから、テキスト間の構造や背景をより正確に把握でき、精度の高い回答を出力可能です。
請求項1における生成AIの役割
本特許においては、生成AIは「主役」であると同時に「部品」として扱われています。
以下の二点が特徴的です。
- 生成AI自体の内部構造や学習方法は特許の中心ではない
- 生成AIをどう使うか、どう入力するかが発明の本質
このように生成AIを「ブラックボックス」(内部構成を特定せず、外部仕様として利用する形)として扱い、生成AIを活用する条件などに特徴を持たせることは、生成AI関連発明として非常に実務的で、権利化しやすいアプローチといえます。
なお、この記事では、「ブラックボックス」は、内部の仕組みは詳しく扱わず、「入力すれば結果が出るもの」として使用しています。
この発明から見える 生成AIを活用した発明のコツ

特許第7742475号から学べる生成AI発明の重要なポイントは次の通りです。
- 生成AIそのものを発明しなくてもよい=生成AIの処理の特性を活用している
- 生成AIそのものではなく前処理前(生成AIに渡す前のデータ整理)・後処理(生成AIが出力したデータの整理)に着目する
- 入力データの形式・構造・表現方法を工夫する
- 「処理速度の向上」や「精度の向上」という効果が達成される具体的な処理手順を示す
単に「生成AIを使って〇〇する」ではなく、生成AIによる処理の前後の工夫を発明として切り出すことが、実務上非常に有効です。
このアプローチであれば、生成AI自体に詳しくない企業や個人であっても特許を取得できる可能性があります。
この発明を応用した生成AI活用発明の例
本発明の考え方は、さまざまな分野に応用できます。
- コールセンター向けFAQ生成支援システム
- 法務・特許分野の質問応答支援ツール
- 医療・金融分野における専門質問対応生成AI
- 社内ナレッジ検索+回答生成システム
これらのいずれも、「質問文+構造化情報+視覚化データ」を生成AIに入力することで、回答品質の向上が期待できます。
まとめ

今回紹介した特許第7742475号は、生成AIにおける入力情報設計の重要性を明確に示した発明です。
生成AIそのものの高度化ではなく、「生成AIに何をどう渡すか」を技術として整理し、特許として成立させている点に大きな価値があります。
生成AIを活用した特許を検討する際、本発明は「生成AI×前処理設計」という有力な方向性を示す良い例といえるでしょう。
生成AI(大規模言語モデル)の急速な普及により、「生成AIをどう使うか」だけでなく「生成AIにどう入力するか」が、サービス品質や競争力を左右する時代になっています。
この特許の考え方は、進歩性判断においても評価されやすい着眼点です。
みなさんも生成AIに入力するデータの工夫をしていませんか?
みなさんが「当然」だと思っている工夫に、まだ特許化されていない発明が存在するかもしれません。
是非、一度考えてみてください。
生成AIの技術はまだ新しい技術です。
前例が少ない分野ですので、「この技術は発明なのか?」「これを出願(申請)したら特許になる可能性はあるのか?」と疑問をお持ちの方、ご自分で判断するのは難しいと思います。
前例が少ない生成AIの技術こそ、出願前に弁理士などの専門家へ相談することをおすすめします。
最後までお読みいただきありがとうございました。

