
Фотография продолжает развиваться в постоянном взаимодействии с активно обновляющимися технологиями. Сегодня, наиболее заметное влияние на фотографию как с технической, так и с эстетической точек зрения оказывают технологии машинного обучения. Современные фотографы используют технологии машинного обучения для создания и обработки изображений.
Нейросети расширяют возможности творчества. Однако, несмотря на доступность этих инструментов, креативность остается прерогативой человека. Такие художники Марио Клингеманн, София Креспо, Рефик Анадол показывают как ИИ может сочетаться с человеческой изобретательностью, предлагая взгляд на будущее фотографии как креативного медиа. В данном тексте мы рассмотрим три способа интеграции нейросетей в процесс создания изображений и их влияние на фотографию как выразительное средство.
Фотографию можно рассматривать как частный случай изобразительного искусства, основанный на плоскости (стена, монитор или фотобумага), на которую проецируется изображение. Виллем Флюссер описывает фотографию как «означающую поверхность». Отличие фотографии от живописи заключается в процессе её создания и преобразования явлений, что обсуждали В. Беньямин, Р. Краусс, П. Бурдье и другие. На фоне современных теорий медиального, где ревизируются понятия медиа-специфичности, мы видим сближение фотографии и живописи.
Томас Деманд (Thomas Demand). Диспетчерская. 2011
Рассматривая техногенные образы, важно определить специфику медиальных практик, чтобы выявить смыслы, возникающие при смешении медиа. Современные художники становятся операторами нейросетей, что приводит к семантическим сдвигам: фотографии переходят от индексальности к иконичности; гиперреализм ИИ ведет к необходимости пересмотра восприятия фотографии; кроме этого меняются подходы к таким категориям как «стиль» и «авторство».
Созданные искусственным интеллектом образы близки фотографии по языку, но, будучи сгенерированными вне прямого контакта с реальностью, они скорее относятся к графике. Цель статьи — переосмыслить нейросетевую фотографию как новую форму графики, которая, взаимодействуя с живописью, открывает новые горизонты визуальной культуры. В исследовании будут рассмотрены три способа применения ИИ в фотографии: обработка снимков, стилизация и генерация по текстовому описанию.
Чаще всего нейросети используются в фотографии для обработки изображений: цветокоррекции, удаления шума и ретуши. Эти технологии позволяют добавлять элементы, менять фон и восстанавливать старые фото, упрощая работу и способствуя демократизации фотографии. Нейрофотография стала новой волной в создании образов, схожей по значению с появлением мобильной фотографии.
Джефф Уолл (Jeff Wall). «Разговор мертвых солдат», 1992
Тем не менее, вопрос о том, является ли нейрофотография «фотографией», остаётся открытым. Относительно цифровой фотографии Андре Руйе утвержал, что такая фотография уже утратила «режим истины» аналогового снимка, который зависел от прямой связи с реальностью через свет. Теперь изображение можно создать без этой связи и зритель не может отличить документальное изображение от гиперреалистичной графики. Художники, такие как Грегори Крюдсон, Томас Деманд и Джефф Уолл, исследуют границы достоверности изображения, а Дж. Уолл подчеркивает искусственность, используя постановку, освещение и актёров, создавая иллюзию спонтанности.
Работа Дж. Уолла «Разговор мертвых солдат» (1992), подталкивает зрителя к размышлению о «фотографической правде». Параллельно Жан Бодрийяр критиковал доверие к СМИ в эссе «Войны в Заливе не было» (1991), подчеркивая манипуляции, которые искажают реальность. Вопросы доверия к изображениям становятся особенно острыми в свете современных подделок (deep fake), где работа нейросетей часто остается незаметной.
Папа Франциск I в пуховике. Дип фейк, созданный с помощью Midjourney
С сентября 2023 года TikTok начал отмечать контент, созданный с помощью ИИ, но этот знак легко подделать. Вопрос в том, как зрители отличают фотографию от генерации и какие ценности связаны с традиционной фотографией. Ведь генеративная фотография ставит под сомнение знаковую природу изображений, которые теперь отсылают не к реальности, а к другим изображениям, на которых обучена ии-модель. Переход к цифровым и автоматическим фотореалистичным изображениям — серьёзный вызов для культуры.
Исследования 2022 года показали, что зрители часто не различают фотографии, созданные людьми и ИИ, как видно из случая с вирусным «снимком» Папы Франциска в пуховике, созданном с помощью Midjourney. С развитием технологий небольшие маркеры подделок, как сливающиеся пальцы, исчезают, и генеративные изображения сливаются с потоком стоковой фотографии. Вопрос также в том, сможет ли ИИ достичь уровня человеческой гениальности, например, воссоздать «Джоконду» или работы Робера Дуано, учитывая, что гений создает новый принцип, а ИИ — лишь подражает.
Имитация стиля фотографа или художника стала популярной функцией нейросетей. С помощью алгоритмов и обучающих данных сети могут анализировать характерные черты стиля конкретного автора и применять их к другим изображениям, что вызывает юридические вопросы из-за возможности подделки фирменного стиля художников.
Альфред Стиглиц «Эквиваленты», 1930
Облака, которые никогда не существовали. Сгенерировано с помощью нейросети «Шедеврум» для данной статьи
Имитация стиля не нова: маньеристы копировали Рафаэля, последователи Караваджо — его стиль. Однако нейросети полностью алгоритмизируют и автоматизируют имитацию, создавая цепочку копий (идея — объект — фотография объекта — ИИ-изображение).
Художница Элизабет Прайс, лауреат премии Тёрнера, провела эксперимент, задавая ИИ философские вопросы: ответы были стереотипны и ограничены. Например, вопрос о расовой идентичности привёл к генерации людей с темной кожей, что, по словам Прайс, отражает предвзятые исходные настройки технологии [Jones, 2022]. Элизабет Прайс предположила, что взаимодействие с нейросетью похоже на обращение к «коллективному бессознательному».
Элизабет Прайс (Elizabeth Price). Ответы нейросети на вопросы. Слева: «Как ты понимаешь рассовую идентичность?». Справа: «Что ты думаешь о родительской любви?», 2022
В сходном проекте Тревор Паглен и исследовательница ИИ Кейт Кроуфорд исследовали работу алгоритмов ImageNet — базы данных, разработанной Стэнфордским университетом для классификации объектов с помощью нейросетей. Классификация базируется на метках, которые могут варьироваться от нейтральных до оценочных. Паглен и Кроуфорд создали онлайн-проект ImageNet Roulette, который позволял пользователям загружать свои фотографии и видеть, как нейросеть их классифицирует. После неоднозначных результатов, где некоторых пользователей ошибочно определяли как «преступников», часть изображений и категорий была удалена из ImageNet.
Проект подчеркивает существующие предвзятости и ограничения таких систем классификации. Паглен и Кроуфорд пояснили, что ImageNet Roulette был создан как провокация, чтобы осветить и проблему категоризации людей на основе алгоритмов, и возможные социальные последствия. В 2020 году инсталляция проекта была представлена в галерее Fondazione Prada в Милане. Авторы проводили параллели с работами Ломброзо и Бертильона и отметили, что первые технологии распознавания лиц в США также обучались на базе данных, содержащей изображения арестованных без их согласия.
Text-to-image генерация образов представляет собой создание визуальных образов нейросетями, которые работают с большими данными и создают изображения, автономные от реальных объектов.
Примером является проект «This Person Doesn’t Exist», использующий генеративно-состязательные сети (GANs) для создания фотореалистичный, но полностью вымышленные лица. GAN объединяет генератор, создающий случайные изображения, и дискриминатор, обучающийся отличать реальные изображения от сгенерированных. На основе анализа реальных данных сеть создает новые лица, комбинируя черты и текстуры, что делает изображения пригодными для использования в графическом дизайне и других креативных проектах.
Вопрос о том, можно ли по лицу «прочесть» личность, ранее поднимался Томасом Руффом в его проекте «Портреты», в котором, снимая людей в манере паспортных фото, он создал эффект эмоциональной пустоты. Такие лица не отсылали ни к чему конкретному, образы этих людей оставались непроницаемыми. Такой эффект только усиливается, когда зритель осознает, что не может отличить фотографию реального человека от генерированного образа несуществующей личности. В то время как, рассматривая снимки Августа Зандера из Альбома «Люди ХХ века» мы словно переносимся в Германию 1930-х годов.
Август Зандер (August Sander). Фотографии из альбома «Люди XX века», 1930-е
Томас Руфф (Thomas Ruff). Фотографии из проекта «Портреты», 1981 — 1999
Ряд художников развивает идеи генерации в искусстве. Марио Клингеманн, например, создал инсталляцию «Воспоминания прохожих I» (2019), где отображаются искаженные «портреты» несуществующих людей, напоминая карикатуры. София Креспо использует нейросети для создания изображений вымышленных животных, в «Нейронном зоопарке» формируя фантастический мир, напоминающий средневековые бестиарии. Рефик Анадол демонстрирует возможности генерации в реальном времени через свои инсталляции, например, «Serpenti Metamorphosis» в Милане, 2019, созданную в коллаборации с брендом Bvlgari.
Вопрос эстетической значимости генеративной фотографии интересен в контексте работы Альфреда Штиглица и его серии «Облака» (1930), где он использует различные композиционные приемы и методы обработки, чтобы передать «случайную» красоту облаков. Штиглиц, стремящийся запечатлеть изменчивую красоту окружающего мира и отражая свои эмоции, стал предтечей субъективной фотографии.
Марио Клингеманн (Mario Klingemann). «Воспоминания прохожих I», 2020
София Креспо (Sofia Crespo) «Нейронный зоопарк», 2022
Снимки, созданные автоматически или случайно, требуют авторского контекста, чтобы быть частью художественного высказывания. Сходство между разными художественными формами не означает их идентичности, и даже натуроподобие не всегда связано с реальностью. Академическая живопись, как «Римляне времен упадка» Тома Кутюра (1847), может быть эстетически привлекательной, но она представляет собой обобщенный образ, а не точную историю.
Изображения, созданные нейросетями, не являются «запечатленным временем», а представляют собой обобщенные визуальные данные, которые вызывают эффект узнавания благодаря коллективному культурному опыту. Сравнение постановочной фотографии и генеративной может показаться неуместным, но постановочная фотография восходит к живописи, а принципы «хорошего искусства» становятся основой для обучения нейросетей. Таким образом, искусное искусство превращается в искусственное искусство.
Можно возразить, что постановочная непикториалистическая фотография не зависит от живописи, но более глубокий анализ процесса означивания подтверждает обратное. Например, знаменитая фотография Р. Дуано «Поцелуй у ратуши» часто получает негативные оценки, воспринимаемая как фальшивка или пропаганда. Это поднимает вопрос о коммерциализации образов, к которому обращался К. Гринберг в своей критике искусства. Дуано не отсылает к классическим картинам, как это делает Рейландер, но создает «желанное» изображение, получая массовое одобрение.
Нейросети, в свою очередь, подражают этим «упакованным» образам, опираясь на алгоритмы, которые отбирают привлекательные визуальные данные. Таким образом, генерация изображений становится имитацией стиля, отражающего мышление капиталистической культуры. Вопрос «кто говорит?» можно переформулировать как «кто обучает?», указывая на маркетинговые стратегии и фильтрацию информации в базах данных.
Рассмотрим вопрос взаимодействие автора с ИИ. Генерация изображений происходит через текстовые запросы (промты), и точность этих запросов определяет релевантность результата. Поэтому стоит вспомнить о семиологических исследованиях означающего и означаемого. Например, работа Джозефа Кошута «Один и три стула» (1965) поднимает вопросы о неустойчивой связи между словом и образом. Разрыв между индивидуальным восприятием текста и генерацией нейросети открывает новые возможности для исследования языка, принимая во внимание программные ограничения нейросетей, включая запреты на создание контента (ню, расовая дискриминация и т. д.). Эти ограничения могут негативно влиять на творческий процесс, так как многие современные художники стремятся обсуждать острые социальные противоречия через провокационные визуальные образы.
Цензура делает нейросеть медиумом с установленными правилами. Художники должны обходить эти ограничения, используя иносказательный язык, что может ослабить силу их художественного высказывания. Это поднимает важные вопросы: кто устанавливает нормы для контента, создаваемого с помощью ИИ и как это влияет на культурные нарративы и возможности самовыражения художников.
Джозеф Кошут (Joseph Kosuth). «Один и три стула», 1965
Выделим три ключевых аспекта анализа нейрофотографии:
С точки зрения семиотики, с 1990-х годов обсуждается знаковая природа фотографии, особенно в контексте цифровой фотографии. По модели Ч. Пирса, фотография является индексальным знаком, так как она запечатлевает воздействие света на фотопленку. Однако цифровая фотография меняет эту семиотическую ситуацию. Лев Манович подчеркивает, что логика цифровых медиа сочетает непрерывность и прерывание: цифровые изображения разрывают семиотические коды, но одновременно усиливают их. Цифровые медиа позволяют неограниченные манипуляции с изображением, что ослабляет его связь с «режимом истины» и ставит под сомнение ценность фотографии для культуры. Манович заключает, что цифровое изображение уничтожает фотографию, но в то же время укрепляет её значение, создавая новую форму фотографии.
Технологии генерации образов, создающие реалистичные изображения, все дальше отводят нас от индексальной природы фотографии как свидетельства. Это может возродить интерес к классическим аналоговым практикам, чья значимость возрастает в эпоху постправды, и стимулировать развитие цифровой живописи и графики. Важной становится категория авторства, вокруг которой возникают теоретические дискуссии и художественные проекты. Классический мимесис требует от художника точно воспроизводить природу, но с развитием фотографии выяснилось, что авторский вклад проявляется в выборе ракурса, который передает концептуальный идеал.
С появлением искусственного интеллекта процесс «кадрирования» становится выбором концептуальной рамки и области больших данных, которую автор может творчески интерпретировать. Нейросети открывают новые горизонты концептуализации опыта.
Что касается зрителя, то художники, работающие с нейросетями, создают интеллектуальную дистанцию, призывая их критически осмысливать возможности нейросетей и вопросы творчества, уникальности и прогресса. В условиях увеличения фейковых изображений, некоторые из которых могут вводить в заблуждение, зритель должен развивать критическое восприятие визуальных образов. Как отмечал Ги Дебор, современное пространство становится местом смешения реального и вымышленного. Как для театра необходима «приостановка неверия», так и для работы с визуальными образами требуется «приостановка веры». В эпоху постправды зрителю нужно усваивать недоверчивый взгляд на фотографии, что поможет защититься от манипуляций и увидеть побочные эффекты генерации изображений. В статье мы проанализировали примеры, когда художники выявили расизм нейросетей или ошибки восприятия, демонстрируя, как медийная поверхность становится зеркалом наших бессознательных установок и рациональности.
Современный человек все чаще воспринимает мир через призму технологий, как в прямом (через объектив фотоаппарата), так и в переносном смысле (мысленно «кадрируя» визуальное поле). Исследование трансформаций культуры, вызванных научно-техническим прогрессом, становится актуальным и необходимым. В статье мы анализируем нейрофотографию как репрезентативную область визуальных медиа, отражающую семиотические сдвиги, влияющие на художественный и социокультурный процесс.