外部データを利用したLLM出力精度の向上と著作権問題(ファインチューニング、セマンティック検索、In-Context Learning、RAG) | Peatix tag:peatix.com,2011:1 2024-01-25T16:30:07+09:00 Peatix STORIA 外部データを利用したLLM出力精度の向上と著作権問題(ファインチューニング、セマンティック検索、In-Context Learning、RAG) tag:peatix.com,2023:event-3779992 2023-12-26T15:00:00JST 2023-12-26T15:00:00JST FAQシステムやチャットボットなど「何か知りたいこと(検索文・質問文)」を入力して検索や回答生成を行うに際して、検索や回答精度を向上させたり、回答根拠を明示させるために、LLM技術と外部データを組み合わせたシステムの研究開発や実装が急速に進んでいます。 LLMが外部データを参照できるようにするには、LLMそのものをFine-tuningする方法、プロンプトで情報を与える方法、RAGによって外部データを保存したデータベース (Data Base; 以下DB) から呼び出す方法の3つがあります。 ここでいう「外部データ」とは、「LLMの外部にあるデータ」という意味でして、その中には社内文書や、書籍・ウェブページ上のデータなどが含まれます。当該「外部データ」の中には、他人が著作権を持つ著作物(以下「既存著作物」といいます)も含まれるため、それら既存著作物を外部データとして利用する場合には、、著作権侵害にならないよう注意をする必要があります。 そこで、本セミナーでは、LLM技術と外部データ活用による検索・回答精度向上のいくつかの手法(ファインチューニング、セマンティック検索、In-Context Learning、RAG)と著作権侵害についてお話をします。■ 主催:STORIA法律事務所■ 講師弁護士柿沼太一【プロフィール】 1997年京都大学法学部卒業。2000年弁護士登録。2015年にスタートアップのサポートを重点的に取り扱うSTORIA法律事務所を共同設立して現在に至る。専門分野はスタートアップ法務、AI・データ法務、ディープテック法務。経済産業省「AI・データ契約ガイドライン」検討会検討委員(~2018.3)。「オープンイノベーションを促進するための技術分野別契約ガイドラインに関する調査研究」委員会事務局(~2022年3月)。JDLA有識者委員。■ 日時 2023年12月26日(火曜日)15:00~16:30(90分)■ 場所 オンラインセミナー(詳細は後日ご連絡します) *セミナー終了後のアーカイブ配信を行うかは未定です。■ 参加費用 無料■ その他 法律事務所所属の弁護士の方は参加をご遠慮ください。■ セミナーの内容(変更可能性あり)1 はじめに2 ファインチューニング(1)ファインチューニングとは(2) ファインチューニングと著作権法3 セマンティック検索(1) セマンティック検索とは(2) 3つのパターンと著作権法30条の4・同法47条の54 In-Context Learning(1) In-Context Learningとは(2) 3つのパターンと著作権法30条の4・同法47条の55 RAG(拡張検索)(1) RAG(Retrieval Augmented Generation、拡張検索)とは(2) 3つのパターンと著作権法30条の4・同法47条の56 30条の4と47条の5の関係について7 文化庁資料について8 著作権侵害にならないシステム設計とは9 複数主体が関与する場合(1)ユーザーが著作権侵害の責任を負う場合(2)サービサーが著作権侵害の責任を負う場合