AIは香水を作るのか、それとも平均値を作るのか?

Premiere Peau 1 min

香水調香師のスタジオとはまったく異なる実験室のどこかで—数百の茶色い瓶が並ぶオルガンも、机の上で孔雀のように扇がれるテイスティングストリップも、ドアの後ろに掛けられた革の汚れたエプロンもない—機械が香水を調合している。その機械は匂いを感じない。鼻もない。ベチバーがグレープフルーツとよく合うかどうかの意見も、トップノートにもっと軽さが必要か、ベースにもっと温かみが必要かという直感も持たない。持っているのはデータだけだ。過去100年分のおよそ40万の処方がデジタル化され、消費者パネルの評価、販売数、地域ごとの好み、分子記述子とともにラベル付けされている。特定の成分の組み合わせと消費者の反応—購入意向、知覚品質、感情的連想、再購入確率—との統計的相関を識別するよう訓練されたアルゴリズムがある。そして、あらゆる測定可能な基準で最適となる処方を作るように求められている。

12分

その機械は成功するだろう。作り出す処方は消費者パネルで高評価を得る。多様な人口統計で好意的にテストされる。誰も不快にさせず、誰も混乱させない。業界が「商業的均衡点」と呼び、機能的な鼻を持つ誰もが「馴染み」と呼ぶ、快適で人口の多い嗅覚空間の領域を占める。多くの人が出会ったときに「完璧に良い」と判断する香りになるだろう。

問題は、「完璧に良い」ことが香水であるかどうかだ。


機械学習の香水開発への応用は推測的なものではない。現在、世界最大の香料・香料企業の研究部門で産業規模で行われている。技術の洗練度は様々で—あるシステムはコストや入手可能性に基づく成分の代替を提案する比較的単純な予測モデルであり、他は数十年分の独自処方データで訓練された深層ニューラルネットワークである—が、根底にある論理はすべて同じだ。既存の処方と消費者反応データの大規模なコーパスを機械に与え、分子組成と人間の好みの統計的関係を学習させる。そして、消費者に望ましい結果を最大化する新しい処方を生成させる。

本質的には、香水に応用された回帰分析である。意味のある意味での創造ではない。

この区別は重要であり、その理由についての正確さが必要だ。回帰分析は、多くの機械学習の中心にある数学的手法で、データ点の雲の中で最適な直線を見つける。中心傾向を特定し、平均がどこにあるかを教えてくれる。多くの応用に非常に役立つ。不動産価格、消費者行動、病気の経過、選挙結果を予測したいなら、平均を知ることは多くを語る。しかし、香水は予測の問題ではない。少なくとも歴史的には創造的な問題であった。創造的な問題は中心を見つけることで解決しない。周辺を見つけることで解決する。

業界を真に変えた香水、振り返れば時代を定義し新しいカテゴリーを開いた処方はすべて、その時代のコンセンサスから逸脱することで成功した。1882年の最初のモダンなフリージアは、当時の男性用香水に誰も期待していなかったものだった。1920年代の最初の大きなアルデヒドフローラルは、当時の女性用香水に誰も期待していなかったものだった。1980年代のジヒドロミルセノールとヘディオンを使った最初のフレッシュな男性用香水は、当時の男性用香水に誰も期待していなかったものだった。2000年代初頭の最初のクリーンな肌のムスク分子香水は、誰も期待していなかったものだった。いずれの場合も、処方が成功したのは既存の好みに合致したからではなく、新しい好みを生み出したからだ。中心を見つけたのではなく、中心を動かしたのだ。

歴史的データで訓練されたアルゴリズムは、構造上、中心を動かすことはできない。見つけることしかできない。外科的精度で中心を見つけ、どんな人間の調香師も及ばない効率で均衡点を占める処方を生成できる。しかし、均衡点を占めることは革新ではない。最適化だ。そして香水の歴史は、最適化と革新は同じではなく、むしろ対立することもあることを示唆している。


反論がある。真剣に検討する価値がある。反論はこうだ:人間の調香師もある意味でアルゴリズムである。彼らは生物学的ニューラルネットワークであり、嗅覚データのコーパス—感じたすべて、学んだすべての処方、キャリアを通じて観察した消費者の反応—で訓練されている。彼らの創造的プロセスは、ロマンチックに想像されるようなミューズからのひらめきではない。パターン認識、再結合、反復的な洗練だ。調香師はオルガンに座り、経験と直感に基づいて原料を選び、試作処方を混ぜ、評価し、調整し、再評価する。プロセスは経験的であり神秘的ではない。もし機械が同じ操作をより速く、より体系的に行えるなら、何が失われるのか?

失われるのは「誤り」だ。

逆説的に聞こえるかもしれないが、正確に言おう。人間の調香師は誤りを犯す。成分を過剰に使い、その過剰が予期せぬ効果を生むことを発見する。試作ロットを偶然汚染し、その汚染物質が興味深いものを加えることを発見する。合成香料の突破口の歴史はこうした幸運な偶然に満ちている。自分のノートを誤読し、意図しなかった原料を組み合わせ、その結果が計画より良いものになる。香水の歴史はこうした事故であふれている—意図的な設計ではなく、より慎重なプロセスが防いだであろう原料の予期せぬ衝突によって特徴が生まれた処方が。

アルゴリズムはこうした誤りを犯さない。指示されたことだけを正確に行う。目的関数を最適化し、勾配に従う。偶然に未踏の領域に踏み込むことはない。数学的精度で最適解に向かう。そして、消費者パネルのデータで定義された最適解は常に中心、平均、コンセンサスだ。

誤りの創造的可能性はロマンチックな幻想ではない。あらゆる創造的分野でよく記録された現象だ。ペトリ皿の汚染からペニシリンを発見した生物学者。アンテナの説明できないノイズから宇宙背景放射を発見した物理学者。コンサート中に弦が切れて即興演奏を強いられ、新しい和声言語を発見した音楽家。これらは不器用な人を慰めるための作り話ではない。創造的突破口はしばしば計画からの逸脱から生まれ、逸脱を排除するシステムは突破口の可能性も排除するという一般原則の記録された事例だ。


もう一つの哲学的な反論がある。香水の好みそのものの性質に関わる。

これらのアルゴリズムが訓練される消費者パネルのデータは、自己申告の好みを測定している。人々が尋ねられたときに好きだと言うものを記録している。しかし、自己申告の好みと実際の好みは同じではない。自己申告の好みは保守的だ。馴染みのあるものと未知のもののどちらかを選べと言われれば、多くの人はほとんどの状況で馴染みを選ぶ。これは愚かさではない。心理学者ロバート・ザイオンツが1968年のJournal of Personality and Social Psychologyで初めて記述した「単純接触効果」というよく知られた認知バイアスであり、共有語彙がない嗅覚評価では特に強く働く。真に新しい香り、既存のどのカテゴリーにも当てはまらず、混乱と興味を同時に引き起こす香りに対しては、消費者パネルはたいてい低い評価を与える。香りが悪いからではなく、評価する枠組みがないからだ。

消費者パネルのデータで訓練されたアルゴリズムはこの保守性を受け継ぐ。新しさはリスクが高く、馴染みは安全だと学ぶ。人々が最も高く評価する香りは、すでに高評価を得た香りに最も似ているものだと学ぶ。つまり、消費者調査の最も基本的な教訓を学び、それに従って最適化する。

結果は、業界が「安全な選択肢」と呼ぶものを生み出すことに非常に長けた機械だ—失敗しない、最低限の商業的成功を収める、誰も驚かせず、不快にさせず、挑戦しない香り。これらの香りは売れる。中には非常に売れるものもある。しかし業界を変えることはない。業界を変えるには、消費者パネルが評価できないものを生み出す必要がある。香水の歴史を変えた処方はすべて、創作時点で驚きだった。誰も求めていなかったもの、予備テストで良いスコアを出さなかったもの、データが成功を示していなかったが、調香師やクリエイティブディレクター、起業家の誰か一人がデータに反して信じたものだった。

アルゴリズムはデータに反して信じることはできない。データに反して信じることは、アルゴリズムが本質的にできない唯一のことだ。アルゴリズムはデータに従う。それが長所であり限界でもある。そして、最も重要な決定がデータに反するものであり、創造的進歩の歴史がコンセンサスを無視して正しかった人々の物語である分野では、この限界は小さくない。根本的だ。


私が支持しないことをはっきりさせよう。人工知能が香水に全く役割を持たないとは言わない。明らかで価値ある応用がある。規制変更で制限成分が除去される際の処方変更を加速できる。価格を下げつつ処方の特徴を維持する経済的な代替案を提案できる。大量の消費者フィードバックデータを分析し、人間のアナリストが見逃す傾向を特定できる。可能な成分組み合わせの多次元空間をマッピングし、人間の調香師がまだ探求していない領域を明らかにできる。かつてガスクロマトグラフィーが商業秘密に閉ざされていた処方を解読したのと同様に。これらは有用な機能だ。時間を節約し、コストを削減し、調香師のツールボックスを広げる。真剣な人は反対しない。

私が主張するのは、これらはすべて最適化の機能だということだ。既存のプロセスをより効率的にする。創造はしない。最適化と創造の違いは単なる言葉の問題ではない。既知の風景を通る最良のルートを見つけることと、風景が既知の境界を超えて広がっていることを発見することの違いだ。機械学習は前者に優れている。後者は構造的にできない。なぜなら後者は定義上、データを超えることを要求し、機械学習は定義上、データからパターンを抽出する方法だからだ。

香水業界が計算ツールに熱狂するのは理解できる。現代の香水経済は厳しい。商業用香水の開発期間は数年から数ヶ月に圧縮された。ブリーフは厳しくなり、予算は小さくなり、失敗のコストは高くなった。この環境で、許容できる処方に到達するための反復回数を減らせるツールは非常に価値がある。しかし「許容できる」はこの文で大きな役割を果たす。許容できる処方とは、ブリーフに応え、テストで十分なスコアを得て、コスト上限を超えないものだ。許容できる処方は傑作ではない。多くの場合、特に面白いものでもない。十分なものだ。そして産業規模では、十分さは芸術の敵だ。


最後にもう一つの考慮事項がある。おそらく最も厄介なものだ。香水開発が消費者データで訓練されたアルゴリズムにますます依存するほど、業界の生産は統計的平均に収束していく。AIで最適化された新しい処方は、設計上、好みの分布の中心を占める。時間とともに中心自体は移動するがゆっくりだ。なぜならアルゴリズムの生産が訓練に使われた好みを強化するからだ。AIで最適化された香りに繰り返し触れた消費者は、その香りによって形成された好みを持ち、その好みが次世代アルゴリズムの訓練データになる。結果はフィードバックループだ:機械は人々が好きなものを作り、人々は機械が作るものを好きになり、機械はさらに多くを作る。

これは仮説的なシナリオではない。アルゴリズムによる推薦や生成システムを採用した他の創造産業で既に起きた正確な記述だ。音楽ストリーミングプラットフォームは、エンゲージメントを最適化するアルゴリズムにより、ポピュラー音楽の音響特性が測定可能な収束を示した—より大きく、より短く、より反復的で、サビが早く来てダイナミックレンジが狭まる。ソーシャルメディアプラットフォームは、注意を最適化するアルゴリズムにより、人気コンテンツの視覚的特徴が収束した—より彩度が高く、トリミングされ、感情的に極端になる。アルゴリズムは意図的に風景を平坦化するのではない。平均を最適化する副作用として平坦化するのだ。

香水業界もこの動態から免疫ではない。業界の開発パイプラインがコンセンサスを最適化するAIツールにますます依存するなら、結果は嗅覚空間の縮小だ。単一の香りへの縮小ではない—市場は広く細分化されすぎている—が、各セグメント内での縮小だ。フレッシュな男性用香水は収束し、甘い女性用香水は収束し、ウードのオリエンタルは収束する。各カテゴリーは内部でより均質になる。なぜなら新しいエントリーを設計するアルゴリズムは、既存のエントリーを生み出したのと同じデータで訓練されているからだ。空間は一点に縮小するのではなく、集合体に縮小する。

これが重要かどうかは、香水が何のためにあるかによる。もしそれが産業であり、市場の需要に応える消費財を生産する商売なら、最適化は正しい戦略であり、収束は許容できるコストだ。消費者は欲しいものを手に入れ、企業は利益を得る。誰も文句を言わない。

しかし、香水が芸術でもあり、既存の好みを満たすだけでなく新しい嗅覚体験の可能性を明らかにする創造的な分野でもあるなら、収束はコストではない。災害だ。なぜなら芸術は、守るに値する定義によれば、驚きの可能性を必要とするからだ。次の処方が誰も嗅いだことのないものであり、どのデータセットも予測せず、消費者パネルが既存のカテゴリーに当てはまらないとして拒否したものである可能性を必要とする。

アルゴリズムはそれを生み出せない。調香師はできる。確実に、安定的に、期限内に、予算内にではない。しかし時折、予測不可能に、商業的論理に反して、数百の茶色い瓶に囲まれたオルガンに座った人間が、どの機械も提案しなかった方法で原料を組み合わせ、その結果は真に新しいものになる。中心を占めるのではなく、中心を動かすもの。データが機能しないと言ったもの。

そうした瞬間は稀だ。ますます稀になっている。そして業界が注意しなければ、完全に起こらなくなるだろう—技術がそれを禁じるのではなく、経済がそれを許さなくなるからだ。機械は調合し、機械は最適化し、機械はすべてのパネルで良いスコアを取り、誰も不快にさせない完璧に良い香水を生み出すだろう。

それが香水と呼べるかどうかは、機械には判断できない。答えるのは鼻でなければならない。

コレクション