AIvs プロ作家:ファインチューニングが起こした逆転劇

著作権で保護された書籍でAIを訓練することの是非が、法廷で争われています。作家たちは、自分の作品を無断で学習させられることに反発しています。しかし、肝心の問いへの答えは曖昧なままでした。「AIは本当に質の高い文章を書けるのか?」159人の読者が下した評価は、予想を裏切るものだったのです。

ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!

ボタンから募集中の求人一覧ページに移動できます。

プロ作家との対決、ファインチューニングが起こした逆転劇

研究チームは、まず公平な条件での対決を設計しました。片方の陣営には、MFA(美術学修士)の学位を持つ専門作家たち。もう片方には、ChatGPT、Claude、Geminiという3つのAIモデルです。課題は、50人の受賞歴のある著者のスタイルを模倣して、最大450語の文章を書くこと。評価を担当したのは159人の専門家と一般読者で、これが盲検ペアワイズ評価だった点が重要です。これは、読者たちが2つの文章を比較する際、どちらが人間で、どちらがAIが書いたものかを知らされない評価方法です。先入観を排除した、純粋な品質勝負でした。
最初の結果は、AI陣営にとって散々なものでした。通常のプロンプト(in-context prompting)で生成した文章は、専門家から強く不評だったのです。文体の忠実性でオッズ比0.16(p<10^-8)、執筆の質でオッズ比0.13(p<10^-7)という数字が、圧倒的な差を物語っています。オッズ比が1未満ということは、人間の作家の方が好まれたことを意味します。一般読者の評価は分かれましたが、専門家の目は厳しかったのです。しかし、ここからが本番でした。
研究チームは次に、ファインチューニング(fine-tuning)という手法を試しました。これは、個々の著者の全作品をAIに学習させ、そのスタイルに特化させる訓練方法です。通常のプロンプトが「お手本を見せて真似させる」方法だとすれば、ファインチューニングは「その作家の全作品を読み込んで、書き方の本質を体得させる」アプローチと言えるでしょう。結果は劇的に変わりました。ファインチューニングされたChatGPTの文章は、専門家の評価で文体の忠実性においてオッズ比8.16(p<10^-13)、執筆の質においてオッズ比1.87(p=0.010)を記録したのです。専門家の読者たちは、AIの文章を「より原作者らしい」と評価しました。一般読者も同様の変化を示しています。さらに驚くべきことに、最良のAI検出器を使っても、ファインチューニングされた文章をAI生成だと見破れませんでした。検出率はわずか3%です。対照的に、通常のプロンプトで生成された文章は97%の確率で検出されました。
なぜこれほどの差が生まれたのでしょうか。研究チームが媒介分析(mediation analysis)を行った結果、答えが見えてきました。通常のプロンプトで生成されたAIの文章には、陳腐な表現(cliche)の密度が高いという検出可能な「癖」があったのです。ファインチューニングは、この癖を排除しました。特定の作家の全作品を深く学習することで、AIはその作家特有の表現パターンを習得し、同時にAI特有の不自然さを取り除いたのです。結果として生まれたのは、非逐語的(non-verbatim)な模倣でした。つまり、原文をそのまま丸写しするのではなく、スタイルの本質を捉えた新しい文章です。この効果は50人の多様な作家全体で確認され、特定の著者やスタイルを超えて一般化されました。
では、このような高品質な文章を生成するコストは、いったいどれほどのものだったのでしょうか。

コスト99.7%削減が突きつける現実、著作権論争の核心

研究チームが算出した数字は、衝撃的なものでした。著者1人あたりのファインチューニングと推論(AIが実際に文章を生成する処理)にかかるコストの中央値は、わずか81ドル。プロの作家に同じ仕事を依頼した場合の報酬と比較すると、99.7%の削減になります。
ただし、研究チームも明記していますが、この81ドルという数字には重要な注意点があります。AIが生成した生の出力を、実際に出版可能な形に整える人間の労力は含まれていません。編集や校正、全体の構成調整といった作業が必要になる可能性は高いでしょう。それでも、コスト面での差は歴然としています。研究チームがこのコストについて言及したのには、理由があります。著作権法におけるフェアユース(公正使用)の判断基準の第4要素が「原著作物の潜在的市場または価値への影響」だからです。つまり、著作権で保護された作品を無断で使用することが、その作品の市場価値にどのような影響を与えるかが、法的判断の重要なポイントになるのです。
この研究が提示したのは、まさにその「影響」についての実証的なデータでした。ファインチューニングされたAIは、元の文章をそのままコピーするのではなく、スタイルの本質を捉えた新しい文章を作り出します。そして、読者たちはその文章を好みました。専門家の読者でさえ、人間のプロ作家が書いた文章よりも、AIが生成した文章の方を「より原作者らしい」と評価したのです。著作権訴訟を起こしている作家たちが恐れていたのは、まさにこの事態でした。自分の作品がAIの訓練に使われ、その結果、自分のスタイルを模倣した文章が市場に出回る。この研究は、それが技術的に可能であるだけでなく、読者からの支持も得られることを示したのです。
市場への影響という観点で考えれば、状況は明確です。ある作家のスタイルで書かれた新しい文章を求める読者がいたとします。従来であれば、その作家本人に依頼するしかありませんでした。しかし今、81ドルというコストで、読者が好む品質の文章を生成できる選択肢が現れました。
この研究が法廷に突きつけたのは、数字という動かしがたい事実です。フェアユースの第4要素「原著作物の潜在的市場または価値への影響」について、もはや抽象的な議論だけでは済まされません。具体的なコスト、読者の評価、そして専門家でさえAIを選んだという現実。これらのデータが、著作権訴訟の行方を左右することになるでしょう。

まとめ

いかがだったでしょうか?
この研究は、AIが著者のスタイルを学習し、読者が好む文章を生成できることを実証しました。ファインチューニングという手法により、専門家でさえ「より原作者らしい」と評価する文章が、わずか81ドルで作成可能になったのです。著作権訴訟の核心である「市場への影響」という問いに、明確なデータが示されました。技術と創作の境界線は、私たちが思っていた場所にはないのかもしれません。法廷での判断がどうなるにせよ、この事実は消えることはないでしょう。

参考資料:Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers

ARCHETYP Staffingではクリエイターを募集しています

私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!

ボタンから募集中の求人一覧ページに移動できます。

クリエイター登録して、案件情報を受け取る!

クリエイター登録