Золотая нейрорыбка

В недрах интернета подспудно зреет очередная промышленная революция. Решение рутинных задач с лёгкостью уже берёт на себя Искусственный Интеллект (ИИ). Написать эссе или код приложения, сгенерировать реалистичное изображение на любую тему, перевести с одного языка на другой «на лету», автономные голосовые ассистенты, распознавание жестов, анализ данных и многое другое всего за несколько секунд максимум минут. Лидеры государств упоминают развитие ИИ как одно из самых приоритетных направлений. Большие корпорации сокращают персонал и увеличивают эффективность процессов на основе нейросетей. Обычные граждане с удивлением обнаруживают новые открывающиеся возможности, которые ещё недавно были только идеями.

 

Нейросети относительно не новое явление, но есть два лагеря. Один знает и пользуется, а другой даже не в курсе происходящего, а если и пользуется какими-то функциями, то не связывает это с работой искусственного интеллекта. И всё бы ничего, но сейчас прогресс в этой области так продвинулся, что начался просто БУМ. Поэтому я решил подробнее изучить это явление и, возможно, сообщить что-то новое тем, кто не успел с ним познакомиться. Помимо рассмотрения принципа работы даю ссылки на сервисы, некоторые из них протестировал сам, а часть добавлялись по ходу написания статьи. Изначально мысль была описать инструкции, как пользоваться тем или иным сервисом. Но по мере погружения в тему оказалось, что количество их постоянно растёт. К некоторым закрывают доступ, где-то меняется функционал, или они из бесплатных становятся платными. В общем, тема настолько животрепещущая и динамичная, что тратить время на инструкции, которые вскоре станут неактуальными, смысла нет. Приведу много ссылок, а вы, если заинтересуетесь, сами попробуете. Подробные инструкции, как пользоваться сервисом, есть на сайтах разработчиков, а также много постов с этой же информацией от энтузиастов. Постараюсь изложить материал так, чтобы эта тема стала понятнее максимальному числу читателей а статья как можно дольше сохранила свою актуальность.

 

Немного истории и терминологии

Тема ИИ существует в культуре уже много лет. Наверное, сложно найти человека, который не имеет об этом представления из книг, фильмов, интернета или других источников. Но в среде учёных всё же есть определённая классификация, которая поможет сориентироваться в различиях и разновидностях ИИ.

 

Искусственный интеллект — это самый общий термин, включающий в себя следующие понятия: машинное обучение, нейросети, глубокое обучение.

 

Машинное обучение — этот подраздел ИИ включает в себя всю массу математических методов, с помощью которой обучают нейросети.

 

Нейросеть — математическая модель, построенная по принципу работы биологических нейросетей. Подробнее о принципе работы и примере обучения см. далее.

 

Глубокое обучение — тонкая донастройка или оптимизация процессов в конкретной нейросети для получения наилучшего результата. Проще говоря — улучшение работы алгоритма.

 

Принцип работы

Основой нейросети является метод обратного распространения ошибки, на разработку которого у учёных ушло порядка 30-ти лет. Нужно учесть, что я не математик и не программист и углублялся в понимание устройства нейросетей для доступного объяснения таким же гуманитариям. В точных науках не все модели можно упростить, при этом не потеряв часть смысла. Однако я постараюсь дать корректное общее представление о нейросетях на момент выхода этой статьи.

 

Если коротко и просто: нейросеть — это программа, которая способна самостоятельно обнаруживать общие признаки чего-угодно и структурировать их.

 

Пример на котиках и собачках и объяснение, зачем НС большое количество данных для обучения

Как объяснить программе, чем отличаются эти два животных — кот и пёс? Ведь по общим признакам они неотличимы. Морда, тело, лапы, хвост... И если вы поднесёте к камере кошку, покрутите её со всех сторон и затем наименуете для нейросети (далее НС), что это кот, а затем то же самое сделаете с собакой, то конкретно этих животных алгоритм запомнит. У него останутся в базе их изображения. А если появится другое животное, например собака размером с кота? Тут опять потребуется помощь человека, который укажет в описании, что всё-таки это 100 процентов собака. Иначе алгоритм определит эту новую собачку как 30 процентов кот (потому что маленькая) и только 70 процентов собака. Так, повторяя процедуру показа разных пород кошек и собак, человек пополняет базу НС. Затем смотрит, какой получился результат и корректирует ошибку, а алгоритм перестраивает всю цепочку, внося туда новые параметры, тем самым становясь умнее (метод обратного распространения ошибки).

Представьте, что вы заграницей изучаете иностранный язык. Каждый раз при общении местный человек корректирует ваше произношение и при необходимости объясняет значение каких-то слов. Так повторяется много раз, с каждым днём вы узнаёте больше и общаетесь всё лучше и лучше.

 

На этой гифке девушка обучает нейросеть различать её и мягкую игрушку.

  1. Gather (собирать). Сначала девушка вносит в программу своё изображение и называет эту запись «Я». Потом записывает аналогичное видео со своей мягкой игрушкой и подписывает «Я и моя собака».
  2. Train (тренировка). Нейросеть анализирует оба видео и определяет различия.
  3. На шаге (Export) видно, как меняется шкала под видео в зависимости от того, кто находится в кадре.

 

Смотрите короткое видео об этом функционале https://experiments.withgoogle.com/teachable-machine

 

Это лишь один из многих способов обучить нейросеть.

Так, исследователи Санкт-Петербургского Федерального исследовательского центра Российской академии наук (СПб ФИЦ РАН) научили нейросеть распознавать несколько десятков слов русского жестового языка на основе анализа видео (https://scientificrussia.ru/).  Эту идею подхватили многие другие и создали свои сервисы для общения между людьми, где жесты ещё и озвучиваются для тех, кто не знает их значение.

 

Рассмотрим ещё пример работы НС на словах

Для наглядности использую одну из НС, через которую разработчики пропустили тысячи «страниц» текста без дополнительных уточнений, что означают слова. Алгоритм анализирует эту информацию и выявляет связи и степень похожести, аналогичности и близости слов. После создаёт трёхмерную модель (смотрите скриншот).

Я вписал слово december (декабрь) и ограничил поиск 50-ю ближайшими словами. Алгоритм НС самые близкие слова, а это, естественно, другие месяцы года, пометил красным. А дальше уже идут слова, обозначающие времена года, цифры и остальные значения по степени удалённости. Ещё раз уточню, нейросеть не знает значение этих слов, просто пропустив через себя много-много текста, она выявила степень близости значений. Человек тут как корректор конечных вариантов в обучении не участвовал.

Программистам ещё недавно пришлось бы прописывать эти взаимосвязи вручную, корпеть над кодом, на это ушло бы много времени. А теперь такой анализ делается за секунды.

Этот эксперимент (http://projector.tensorflow.org/) вы можете проверить сами. Для этого посмотрите обучающий ролик, (https://experiments.withgoogle.com/visualizing-high-dimensional-space) и, хоть он на английском, но с помощью НС теперь можно перевести его «на лету» на русский. Если вы пользуетесь Яндекс браузером, на видео сверху появится кнопка с предложением «Перевести видео».

 

 

А теперь рассмотрим примеры на реальных сервисах, это позволит понять кто как использует эти алгоритмы, и дополнит общую картину об этом явлении. Одно из самых популярных направлений, обратившее в «тихий ужас» художников, — генерация изображений по текстовому описанию.

 

1. Stable Diffusion https://stablediffusionweb.com/ генерирует с нуля, дорисовывает или переделывает имеющиеся наброски. Начинаю с этого сервиса, потому что он бесплатный и с открытым исходным кодом. То есть человек может скачать эту нейросеть себе на компьютер и при надобности дообучить её под свои конкретные нужды.

Вводить описание нужно на английском языке, для простоты используйте онлайн переводчик.  Я написал: «Журналист идёт по улице среди небоскрёбов». Вот таких четыре предварительных варианта  у неё получились за 5 секунд.

 

2. Midjourney https://www.midjourney.com — самая популярная с наилучшей на данный момент генерацией изображений, с огромным количеством настроек стилей. Работает через программу Discord. После регистрации даётся 25 бесплатных попыток, далее платно. По работе в этой нейросети есть огромное количество видеороликов и статей. Я же приведу изображение, которое сгенерировалось по моему текстовому запросу про журналиста и скриншот с некоторыми работами людей, чтобы вы оценили её возможности.

В этом варианте не так угадывается описание, которое я дал для генерации картинки. Тут нужна тренировка и пробы с разным содержанием текста и указанием стилей. С первого раза получить именно тот результат, который вы задумали, вряд ли получится. Но сказать, что это сложно, не могу, просто нужно больше времени. Вот ссылка с наиболее полным руководством по стилям https://pikabu.ru/story/polnoe_rukovodstvo_po_vizualnomu_stilyu_v_neyroseti_midjourney_9851425

Сейчас, кстати, люди развлекаются тем, что кидают в нейросеть строчки из песен, она генерирует изображение а потом это накладывают на музыку.

 

Скриншот по моему запросу «Журналист идёт по улице среди небоскрёбов».

 

Скриншот с галерей пользователей.

 

https://www.midjourney.com/showcase/recent/ Это ссылка на галерею, куда автоматически попадают все изображения, которые генерируются людьми. Всего за несколько секунд каждый может создать себе иллюстрацию, которую раньше мог сделать только профессиональный художник! Да, с авторскими правами пока не понятно. Все доступные изображения вы можете использовать по своему усмотрению, так уверяют разработчики. 

 

3. Также приведу ссылку на основного конкурента  Midjourney — нейросеть Dall-e 2 https://openai.com/dall-e-2/. Для нашей страны доступ ограничен.

 

4. Bluewillow https://www.bluewillow.ai/ тоже НС для генерации изображений. Узнал про неё в конце работы над этой статьёй. Пользователи пишут, что она пока полностью бесплатна и без ограничения по количеству попыток. Работает также через программу Discord. Урок, как зарегистрироваться и пользоваться

 

5. ruDALL-E https://rudalle.ru/ отечественный продукт от Сбербанка. Всё на русском, бесплатно и без ограничений. Есть несколько движков для создания изображений. По качеству и количеству настроек пока уступает аналогам. Название, как видите, взяли от западного сервиса Dall-e 2.

 

 

6. Artbreeder www.artbreeder.com особенностью сервиса является, как считают пользователи, наилучшая среди прочих генерация лиц людей. Также интересный подход с возможностью микшировать два изображения и на основе него получать несколько других, затем опять выбирать, что с чем соединить, и так хоть до бесконечности. То же самое можно делать с пейзажами. Функционал частично платный, для ознакомления достаточно вполне и бесплатной версии.  Привожу пример соединения изображений нескольких людей. На всякий случай напоминаю, это всё сгенерировано нейросетью. Этих людей не существует.

 

 

7. https://colorize.cc/ — отечественные разработчики создали платный сервис для раскрашивания чёрно-белых фотографий и ретуши от царапин или изломов. По обзорам этому НС ставят очень высокие оценки. Со временем предполагаю достать что-нибудь из архивов и попробовать раскрасить.

 

8. https://www.autodraw.com/ — вы рисуете схематично любой объект, сервис пытается угадать и выдаёт подходящие варианты, после этого нажимаете на подходящую иконку, и ваши каракули в это превращаются. Очень удобно для создания схем. Сервис бесплатный.

 

 

9. ChatGPT — нейросеть от той же команды, что и Midjourney (OpenAi). Наверное, одна из самых упоминаемых и продвинутых на данный момент. Доступ для нашей страны ограничен, поэтому ссылок не даю. Конечно, с помощью определённых действий запрет обходится, (ничего противозаконного в этом нет), но люди делают это на свой страх и риск. Поэтому инструкцию для обхода не пишу . Лучше расскажу немного о возможностях этого алгоритма. ChatGPT может решать некоторые логические, математические, физические задачи и давать пояснения, почему ответ именно такой.  Написать эссе на разные темы. Быстро найти информацию о чём либо, например, о лучших курсах по программированию. Составить резюме человеку.  Переписать текст, чтобы у него повысилась оригинальность. Ему можно дать задание написать код приложения на одном из языков программирования или попросить научить, как писать код. Нейросеть может найти подходящую иллюстрацию по описанию в интернете. Вот в общих чертах его возможности. Которыми, кстати, сразу стали пользоваться школьники. И в некоторых государствах уже думают, как изменить образовательные программы, чтобы ученики не могли «жульничать», используя нейросети. Не переживайте, что в данный момент нет простой возможности потестировать ChatGPT. Огромное число компаний уже наступают ей на пятки, долго оставаться флагманом не получится. Гугл, например, недавно анонсировал глобальное обновление всех основных продуктов. Этой весной будет релиз, и, как вы наверное уже догадались, вся линейка будет работать на новых алгоритмах нейросетей.

 

10. Яндекс Архив https://ya.ru/archive  — поиск и автоматическая расшифровка архивных документов середины XVIII — начала XX веков. Архив постоянно пополняется. Пока внесены и распознаны материалы из архивов Москвы, Оренбурга и Великого Новгорода. В основном это записи о рождении, браке, смерти, исповедные записи прихожан церквей. Пользоваться очень просто. Попробуйте, и, возможно, вам повезёт открыть новую информацию о своих родственниках.

 

11. Лаборатория от Гугл https://experiments.withgoogle.com/ — тут десятки разных проектов по направлениям от энтузиастов. Всё в открытом доступе. Пока собирал материал для статьи, зависал тут периодически не на один час.

 

12. https://artsandculture.google.com/experiment/fabricius/gwHX41Sm0N7-Dw — мне понравилась нейросеть для распознавания древних египетских символов. Так выглядит фраза «меня зовут Викториус». Сервис может использоваться как для научных работ, так и для обучения.

 

13. https://artsexperiments.withgoogle.com/artpalette/colors/b5ab8f-a38d8b-b7b5a7-58674b-8a9877  —  а здесь можно выбрать любое цветовое сочетание, и НС подберёт все имеющиеся произведения,  подходящие по этим параметрам.

 

Многие западные издания уже открыто сообщают, что используют нейросети для генерации текста, анализа и сбора данных. Но статьи всё равно в итоге проверяет и корректирует редактор, а также нажимает кнопку «Опубликовать».

 

14. @TurboText_Bot (частично платный) - Как я уже писал, доступ к самой на данный момент продвинутой текстовой нейронке для нас закрыт, поэтому я нашёл один вариант генерации текста отечественного производства. Работает он через телеграмм. Для начала генерации нужно написать два-три предложения, чтобы задать направление. Жирным шрифтом я выделил свои предложения, а остальной текст (выделен курсивом) написала НС (пунктуация и грамматика сохранена). Как по мне, то это пока генератор «воды» для журналиста. Но чем больше людей ею пользуется, тем быстрее она учится. Пока платить за подобное я бы не стал. Этот же чат может генерировать  изображения. В общем, сервис «всё в одном». Думаю, им в большей степени заинтересуются пользователи соцсетей, блогеры или рекламщики для поддержки активности аккаунтов.

 Нейросеть — сложное понятие для многих взрослых не говоря уже о детях. Но прогресс идёт вперед, и то, что сейчас происходит в науке, в будущем используют наши дети. И как объяснить школьнику устройство нейросетей? 

Как объяснить школьнику, почему именно нейросети помогают ему управлять своими эмоциями? Сейчас многие дети ищут ответы на свои вопросы, а вот им ничего не известно. В сети появилась информация о том, что школьники получают информацию из смартфонов, планшетов, смартфонов, компьютеров, планшетов и других устройств, которые могут быть связаны с нейросетями. Именно эти данные и помогают школьникам объяснять, как правильно действовать, когда они видят те или иные объекты. И не нужно забывать о том, как нейросети работают в разных условиях: и от взаимодействия с другими устройствами до связи с другими. Если ребенок говорит, что это его телефон или телефон, можно сказать, что все слова находятся вне рамок их рамки. Так что, если ребенок говорит про что-то про себя, значит он понимает, где он находится. Конечно же, все эти знания надо знать заранее, потому что, когда ты видел видео, то это очень важно, и что можно сделать, чтобы помочь ему понять, какие действия совершают другие люди, но не стоит забывать, что мозг очень быстро реагирует на такие ситуации.

 

Пользователи интернета предполагают, что если тексты, изображения, и публикации будут делать за нас алгоритмы, а также и отвечать в чатах и на голосовые сообщения, то скоро весь интернет станет «мёртвым». Контент будет генериться с огромной скоростью, и понять, общаетесь ли вы с реальным человеком или нет, будет невозможно. Пока для создания дипфейк-видео нужен реальный человек. Но вскоре и этого не понадобится. Дипфейк-технология на основе  НС даёт возможность менять лицо на видео в прямом эфире. Вот, например, сериал «ПМЖейсон» про жизнь Киану Ривза, Джейсона Стетхема и других голливудских звёзд в русской глубинке.

Скриншот одной из серий.

 

Уже сложно найти, в какой из областей человеческой деятельности НЕ используются НС. Поэтому эту статью можно никогда и не закончить. Надеюсь, что заинтересовал тех, кто ничего об этом не слышал. Настало время изменения бизнес-моделей. Так же, как есть менеджер почти в каждой фирме, теперь должен появиться и человек, который будет оптимизировать и обучать нейросеть под нужды компании. К счастью или сожалению, но прогресс не останавливается. На протяжении веков многие специальности отмирают, и на их место приходят другие. Смотрите на это как на новые возможности.

 

P. S. Эта статья написана, проверена и выложена в интернет людьми.

Виктор КУХАРЧУК

Комментарии

, Арина

Добрый день!

Отличная статья. Все те сведения, которые встречались разрозненно на просторах интернета, теперь для меня сложились в единую картину. И, конечно, сразу появилось решить какую-то из своих задач при помощи одной из нейросетей.

Есть такие вопросы к автору. Они или для отдельной статьи, или быстрого ответа, точно не знаю, так как тема для меня совершенно новая.
1. Нейросети можно использовать с любого устройства или что-то предпочтительнее: ноутбук или смартфон. Что удобнее?
2. Есть ли ограничения по ПО ноута или версии Андроида? В том смысле, если ноутбук не самый быстрый, а работа с нейросетями начнёт его сильно тормозить... или ограничений нет?
3. Прочитала про Discord - какой-то "странный" суперпродвинутый мессенджер для геймеров. И стало страшно ставить его на ноут, Вдруг он будет пользоваться какими-то личными материалами. Хотя при установке приложений на смартфон, замечала, что многие теперь просят доступ к "Галерее", Камере", "Диктофону" и так далее... Может автор как-то прокомментирует на основе личного опыта и развеет страхи?

, Виктор

Отличная статья. Все те сведения, которые встречались разрозненно на просторах интернета, теперь для меня сложились в единую картину. И, конечно, сразу появилось решить какую-то из своих задач при помощи одной из нейросетей.

Нейросети можно использовать с любого устройства или что-то предпочтительнее: ноутбук или смартфон. Что удобнее? 

Есть ли ограничения по ПО ноута или версии Андроида?

В том смысле, если ноутбук не самый быстрый, а работа с нейросетями начнёт его сильно тормозить... или ограничений нет?

 

ОТВЕТ:  Нейросети в основной своей массе — это «облачные» технологии, потому что требуют большого ресурса. То есть все вычисления происходят на серверах компании, а нам, пользователям, присылают готовый результат. Уточню, что нейросети — это очень общее понятие. Для пользователей это выглядит как взаимодействие с приложением. Например, Яндекс Алиса. Приложения, использующие НС, могут быть платными, условно бесплатными — за просмотр рекламы например, или бесплатными, что намного реже. Вы выбираете, только исходя из нужного вам функционала. Сейчас стараются делать кроссплатформенные сервисы, но бывают и исключения — только для смартфонов или только для ПК. Если кратко — на производительность ваших устройств это никак не сказывается.

Есть НС, которые вы можете скачать себе на компьютер, например Stable Diffusion, чтобы дообучить её под ваши конкретные задачи. В таком случае старый ноутбук не подойдёт. Чем быстрее «железо», тем быстрее процесс. У каждого алгоритма свои системные требования, как правило, они указаны на сайте разработчика. Как и инструкция по установке и донастройке.

 

Прочитала про Discord - какой-то «странный» суперпродвинутый мессенджер для геймеров. И стало страшно ставить его на ноут, Вдруг он будет пользоваться какими-то личными материалами. Хотя при установке приложений на смартфон, замечала, что многие теперь просят доступ к "Галерее", Камере", "Диктофону" и так далее... Может автор как-то прокомментирует на основе личного опыта и развеет страхи?

 

ОТВЕТ: Discord — один из разновидностей мессенджеров. Он стал популярен у геймеров из-за возможности транслировать свой рабочий стол в играх и попутно общаться. При этом для подключения к трансляции нужна лишь ссылка. Новый пользователь со своей стороны указывает только почту и делает подтверждение со своего ящика. Также Discord может работать по локальной сети, передавая сообщения между компьютерами, что для многих других мессенджеров недоступно. В общем, это один из многих вариантов сервисов для общения и передачи информации, со своими плюсами и минусами. За этим сервисом пока не замечены проблемы с утечкой данных.

В данный момент, находясь в интернете или пользуясь смартфоном, все мы автоматически передаём данные, открыто или скрыто. Избежать этого пока маловероятно. Ведь программы кто-то написал и годами поддерживает производительность, дорабатывает, улучшает, где-то в специально арендованных помещениях стоят дорогостоящие серверы, их обслуживают и меняют запчасти. Для всего этого нужен материальный ресурс. Поэтому приложение либо платное, либо в нём присутствует реклама, либо оно собирает данные о пользователях и продаёт их другим корпорациям для анализа. А также все эти и ещё другие неуказанные варианты вместе взятые одновременно. Есть простые правила для кибербезопастности. Самое главное, это двойная аутентификация, когда для входа требуется подтверждение по смс из телефона или почты. Также старайтесь использовать неповторяющиеся пароли. И конечно, ни при каких обстоятельствах не сообщайте незнакомым информацию об этом.

, Арина

Виктор, спасибо большое за ваш подробный и быстрый ответ. Очень помог. Мне понятно, я так примерно всё себе и представляла. Да, согласна насчёт правил кибербезопасности. И ещё, действительно важно каждому самостоятельно следить за своим "цифровым следом".

Добавить комментарий

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и абзацы переносятся автоматически.
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.
3 + 1 =
Решите эту простую математическую задачу и введите результат. Например, для 1+3, введите 4.