AIは香水を作るのか、それとも平均を取るだけなのか？

香水師のアトリエとはまったく異なる実験室のどこかで、数百の茶色い瓶が並ぶオルガンも、机の上に孔雀の羽のように広げられたテスターも、ドアの後ろに掛けられた染みのついた革のエプロンもない場所で、機械が香水を調合している。その機械は匂いを感じない。鼻もない。ベチバーとグレープフルーツが合うかどうかの意見もなければ、トップにもっと軽さが必要か、ベースにもっと温かみが必要かの本能もない。持っているのはデータだけだ。過去100年分のおよそ40万の処方がデジタル化され、消費者パネルの評価、販売数、地域の好み、分子記述子とともにタグ付けされている。特定の成分の組み合わせと消費者の反応（購入意欲、品質の認知、感情的な結びつき、再購入の可能性）との統計的相関を特定するよう訓練されたアルゴリズムがある。そして、あらゆる測定基準で最適となる処方を作るよう求められている。

12分で読めます

その機械は成功するだろう。作り出す処方は消費者パネルで高得点を獲得し、複数の人口統計で良好なテスト結果を示す。誰も不快にさせず、誰も混乱させない。業界が「商業的なスイートスポット」と呼び、嗅覚の専門家が「馴染み深い」と呼ぶ快適で多くの人が好む領域に位置する。多くの人が出会った際に「十分に良い」と評価する香りになるだろう。

問題は、「十分に良い」ことが香水作りと言えるかどうかだ。

機械学習の香水開発への応用は仮説ではない。現在、世界最大の香料・フレーバー企業の研究部門で産業規模で行われている。技術の洗練度は様々で、コストや入手可能性に基づく成分の代替を提案する比較的単純な予測モデルもあれば、数十年分の独自処方データで訓練された深層ニューラルネットワークもあるが、基本的な論理はどれも同じだ。大量の既存処方と消費者反応データを機械に与え、分子組成と人間の好みの統計的関係を学習させる。そして、望ましい消費者の反応の確率を最大化する新しい処方を生成させる。

これは本質的に、香水作りに応用された回帰分析であり、意味のある創造ではない。

この区別は重要であり、その理由を正確に述べる価値がある。回帰分析は、ほとんどの機械学習の中心にある数学的手法で、データ点の集まりに最適な線を引く。中心傾向を特定し、平均がどこにあるかを示す。これは多くの応用で非常に有用だ。不動産価格、消費者行動、病気の経過、選挙結果を予測したいなら、平均を知ることは多くを教えてくれる。しかし、香水作りは予測問題ではない。少なくとも歴史的には創造的な問題であり、創造的な問題は中心を見つけることで解決されるのではなく、周辺を見つけることで解決される。

業界を本当に変えた香水、振り返れば時代を定義し新しいカテゴリーを切り開いた処方は、すべて当時のコンセンサスから逸脱することで成功した。1882年の最初のモダンなフジェールは、当時の男性用香水の予想を覆した。1920年代の最初の偉大なアルデヒドフローラルは、当時の女性用香水の予想を覆した。1980年代のジヒドロミルセノールとヘディオンを基調とした最初のフレッシュな男性用香水は、当時の男性用香水の予想を覆した。2000年代初頭の最初のクリーンスキンムスク分子は、当時のどの香水の予想も覆した。いずれも既存の好みに合致したから成功したのではなく、新しい好みを生み出したから成功した。中心を見つけたのではなく、中心を動かしたのだ。

歴史的データで訓練されたアルゴリズムは、構造上、中心を動かすことはできない。中心を見つけることしかできない。外科的な精度で中心を見つけ、どんな人間の香水師も及ばない効率でスイートスポットに位置する処方を生成できる。しかし、スイートスポットに位置することは革新ではなく最適化だ。香水の歴史は、最適化と革新は同じではなく、むしろ対立することさえあることを示している。

反論もあり、それは真剣に考慮されるべきだ。反論はこうだ：人間の香水師もある意味でアルゴリズムである。彼らは生物学的なニューラルネットワークであり、嗅覚データの蓄積、これまで嗅いだすべての香り、学んだすべての処方、観察したすべての消費者反応で訓練されている。彼らの創造過程は、ロマンチックに想像されるようなミューズから降りてくるひらめきではなく、パターン認識、再結合、反復的な洗練である。香水師はオルガンに座り、経験と直感に基づいて素材を選び、試作処方を調合し、評価し、調整し、再評価する。この過程は神秘的ではなく経験的だ。もし機械が同じ操作をより速く、より体系的に行えるなら、何が失われるのか？

失われるのは「誤り」だ。

これは逆説的に聞こえるかもしれないので正確に述べよう。人間の香水師はミスをする。成分を過剰に使い、その過剰が予想外で予測できなかった効果を生むことを発見する。試作バッチを偶然汚染し、その汚染物質が興味深い効果を加えることを発見する。合成香料の突破口の歴史はこうした幸運な偶然に満ちている。自分のメモを誤読し、意図しなかった素材を組み合わせ、その結果が計画より良いものになることもある。香水の歴史はこうした偶然の産物であふれており、より慎重な過程なら防げたはずの素材の偶然の衝突によって特徴が生まれた処方も多い。

アルゴリズムはこうしたミスをしない。アルゴリズムは指示されたことだけを正確に行う。目的関数を最適化し、勾配に従う。偶然に未踏の領域に迷い込むことはない。なぜなら迷わないからだ。数学的な精度で最適解に向かって動く。そして最適解は消費者パネルのデータで定義される限り、常に中心、平均、コンセンサスである。

誤りの創造的可能性はロマンチックな幻想ではない。あらゆる創造的分野でよく知られた現象だ。汚染された培地皿のおかげでペニシリンを発見した生物学者。アンテナの説明できないノイズのおかげで宇宙背景放射を発見した物理学者。コンサート中に弦が切れて即興演奏を強いられ、新しい和声言語を発見した音楽家。これらは不器用な人を慰めるための作り話ではなく、一般原理の記録された事例だ。創造的な突破口は計画からの逸脱から生まれることが多く、逸脱を排除するシステムは突破口の可能性も排除する。

計算香水に対する二つ目の哲学的な異議は、好みの本質に関するものだ。

これらのアルゴリズムが訓練される消費者パネルデータは、表明された好みを測定する。尋ねられたときに人々が好きだと言うものを記録する。しかし、表明された好みと実際の好みは同じではない。表明された好みは保守的だ。馴染みのあるものと未知のもののどちらかを選ぶよう求められた場合、多くの人は多くの状況で馴染みのあるものを選ぶ。これは愚かさではない。心理学者ロバート・ザイアンスが1968年にJournal of Personality and Social Psychologyで発表した「単純接触効果」というよく知られた認知バイアスであり、共有された語彙がない嗅覚評価では特に強く働き、消費者がなぜ好きか嫌いかを説明するのが非常に難しい。既存のカテゴリーに当てはまらず、混乱と興味を同時に引き起こす真に新しい香水に直面した消費者パネルは、多くの場合、低い評価をつける。香水が悪いからではなく、評価の枠組みがないからだ。

消費者パネルデータで訓練されたアルゴリズムはこの保守性を受け継ぐ。新奇性はリスクであり、馴染みは安全だと学ぶ。人々が最も高く評価する香水は、すでに高く評価した香水に最も似ているものだと学ぶ。要するに、消費者調査の最も基本的な教訓を学び、それに従って最適化する：人はすでに好きなものを好む。

結果として、業界が「安全な賭け」と呼ぶ、失敗せず、商業的に最低限の成功を収め、嗅ぐ人を驚かせたり不快にさせたり挑戦したりしない香水を作ることに非常に長けた機械が生まれる。これらの香水は売れる。中には非常に売れるものもある。しかし業界を変えることはない。なぜなら業界を変えるには、消費者パネルが評価できないものを作る必要があるからだ。香水の歴史を変えた処方は、創造された瞬間にすべて驚きだった。誰も求めていなかったもの、予備テストで低評価だったもの、データが成功を示さなかったが、香水師やクリエイティブディレクター、起業家の誰かがデータに反して信じたものだった。

アルゴリズムはデータに反して何かを信じることはできない。データに反して信じることは、アルゴリズムが本質的にできない唯一のことだ。アルゴリズムはデータに従う。それが美点であり限界でもある。そして、最も重要な決定がデータに反するものであり、創造的進歩の歴史がコンセンサスを無視して正しかった人々の歴史である分野では、その限界は小さくない。根本的だ。

私が主張していることを明確にしよう。人工知能が香水作りに役割を持たないと言っているのではない。明らかに価値ある応用がある。規制変更で制限成分が使えなくなった際の処方変更を加速できる。価格を下げつつ処方の特徴を保つコスト効率の良い代替案を提案できる。大量の消費者フィードバックデータを分析し、人間の分析者が見逃す傾向を特定できる。かつてガスクロマトグラフィーが企業秘密だった処方を解読したように、膨大な成分組み合わせの多次元空間をマッピングし、人間の香水師がまだ探求していない領域を示せる。これらは有用な機能であり、時間を節約しコストを削減し、香水師のツールキットを拡張する。誰もそれに異論はない。

私が主張しているのは、これらはすべて最適化機能であり、既存のプロセスを効率化するものであって、創造ではないということだ。最適化と創造の違いは単なる言葉の問題ではない。既知の地形を最適なルートで通ることと、地形が既知の境界を超えて広がっていることを発見することの違いだ。機械学習は前者に優れているが、後者は構造的に不可能だ。なぜなら後者はデータを超えることを必要とし、機械学習はデータからパターンを抽出する方法だからだ。

香水業界が計算ツールに熱心なのは理解できる。現代の香水開発の経済は厳しい。商業用香水の平均開発期間は数年から数ヶ月に短縮された。ブリーフは厳しくなり、予算は減り、失敗のコストは高くなった。この環境では、許容できる処方に到達するための反復回数を減らせるツールは非常に価値がある。しかし「許容できる」はこの文で大きな意味を持つ。許容できる処方とは、ブリーフを満たし、テストで十分なスコアを取り、コスト上限を超えないものだ。許容できる処方は傑作ではない。多くの場合、特に面白いものでもない。十分なものだ。そして産業規模では、十分さは芸術の敵である。

最後にもう一つ考慮すべきことがあり、それは最も厄介かもしれない。香水開発が消費者データで訓練されたアルゴリズムツールにますます依存するほど、業界の成果は統計的平均に収束していく。新しいAI最適化処方はすべて、設計上、好みの分布の中心に位置する。時間とともに中心は変化するがゆっくりだ。なぜならアルゴリズムの出力が訓練データである好みを強化するからだ。AI最適化香水に繰り返し触れた消費者は、その香水に影響された好みを形成し、その好みが次世代のアルゴリズムの訓練データになる。結果はフィードバックループだ。機械は人々が好むものを作り、人々は機械が作るものを好み、機械はさらにそれを作る。

これは仮説ではない。アルゴリズムによる推薦や生成システムを採用した他の創造産業で既に起きた正確な現象だ。音楽ストリーミングプラットフォームは、エンゲージメントを最適化するアルゴリズムにより、人気音楽の音響特性が収束した：より大音量、短く、反復的で、コーラスが早く現れ、ダイナミックレンジが狭まる。ソーシャルメディアプラットフォームは、注目を最適化するアルゴリズムにより、人気コンテンツの視覚特性が収束した：より彩度が高く、よりタイトにトリミングされ、より感情的に極端になる。アルゴリズムは意図的に地形を平坦化するのではなく、平均を最適化する副産物として平坦化する。

香水業界もこの動態から免れない。業界の開発パイプラインがコンセンサスを最適化するAIツールにますます依存すると、嗅覚の領域は狭まる。単一の香水に狭まるわけではない。市場は大きく細分化されているからだが、各セグメント内で狭まる。フレッシュな男性用香水は収束し、甘い女性用香水は収束し、アンバーウード香水も収束する。各カテゴリーは内部的により均質になる。なぜなら新しいエントリーを設計するアルゴリズムは既存のデータで訓練されているからだ。領域は一点に狭まるのではなく、クラスターに狭まる。

これが問題かどうかは、香水作りの目的をどう考えるかによる。もしそれが産業であり、市場の需要に応える消費財を作る商売なら、最適化は正しい戦略であり、収束は許容できるコストだ。消費者は欲しいものを手に入れ、企業は利益を上げ、誰も文句を言わない。

しかし、香水作りが芸術でもあり、既存の好みを満たすだけでなく、新しい嗅覚体験の可能性を示す創造的な分野であるなら、収束はコストではなく大惨事だ。なぜなら芸術は、どんな定義でも守る価値があるなら、驚きの可能性を必要とするからだ。次の処方が誰も嗅いだことのないものであり、どんなデータセットも予測せず、消費者パネルが既存のカテゴリーに合わないとして拒否したものである可能性を必要とする。

アルゴリズムはそれを生み出せない。香水師はできる。確実に、安定的に、予定通り、予算内でではないが、時折、予測不可能に、すべての商業的論理に反して、数百の茶色い瓶に囲まれたオルガンに座る人間が、機械が提案しなかった方法で素材を組み合わせ、その結果が本当に新しいものになる。中心に位置するのではなく、中心を動かすもの。データがうまくいかないと言ったもの。

そうした瞬間は稀であり、ますます稀になっている。そして業界が注意しなければ、それらは完全に起こらなくなるだろう。技術がそれを禁じるのではなく、経済的にそれを許さなくなるからだ。機械が調合し、機械が最適化し、機械がすべてのパネルで良いスコアを取り、誰も不快にさせない「十分に良い」香水を作る。

それが香水作りと言えるかどうかは、機械には判断できない。答えるのは鼻でなければならない。

7つの20%のエクストレ、1つのコレクション。ディスカバリーセットは7つすべてを2mlでまとめている。