Лучшая нейросеть для создания музыки — бесплатно, с примерами песен и даже на русском

Сегодня пишем пост с очередным обзором «по заявкам». Прилетела от одного из заказчиков ссылка на нейросеть, которая, по утверждению создателей, умеет создавать цельные, законченные песни. Как сейчас чаще говорят — треки. Причем было заявлено, что нейронка может генерировать не только музыку по описанию, но и качественный вокал со словами, тоже составленными нейросетью — до кучи.

Редакция «Лаборатории контент-маркетинга» тут же приступила к интенсивному тестированию бета-версии сравнительно новой музыкальной нейросети. Делимся с вами результатами, впечатлениями и примерами композиций — с удивлением и прочими эмоциями. Погнали, что ли.

Первые шаги в мир нейронной музыки

Для нас они были реально первыми. До этого никаких серьёзных анализов музыкальных нейросетей мы не делали, экспериментов не ставили и лишь видели боковым зрением какие-то новости по теме. Знали, что есть сервисы, которые могут разложить любую песню на партии — это хорошо работает уже не первый год. Однако сочинять музыку нейросетью под ключ пока не доводилось — было проще взять необходимую музыку без авторских прав и всё. Но тренды надо отслеживать — что и делаем, пусть и с опозданием.

Называется сеть Riffusion, что по нашему мнению подразумевает игру слов riff (то есть музыкальный риф, совокупность аккордов) и fusion (что в частном порядке можно перевести как смешение стилей). Доступ к нейросети в настоящий момент действительно бесплатен — в заголовке нет обмана или кликбейта для заманухи. Всё, что надо для запуска работы — стать зарегистрированным пользователем.

Войти можно, например, по учётной записи Google. И всё, вы сразу получаете полный бесплатный инструмент, без демо-версий и функциональных ограничений. Как минимум — пока бесплатный. И даже без назойливой рекламы. Просто коммунизм. Неужели бесплатное может быть хорошим? Скоро узнаем.

Как пользоваться Riffusion и быстро создавать бесплатную музыку с помощью нейросети

Как-как… В одно касание и в одну строчку. Даже с учётом того, что Riffusion на русском языке пока не представлена, самое простое описание сервиса наподобие нашего вполне поможет разобраться в базовых настройках. Тем более, что они — минимальны.

Перед вами — просто строка, в которую надо вбить промпт — как можно более конкретное описание того, что вы хотите получить в итоге.

Rifusion нейросеть как работать: основы

Вот в поле, где написано Create the music you imagine, вам надо напечатать описание своего будущего трека. Как работать с нейросетью подробнее, мы и описываем далее.

Для самого простого тестирования мы попросили создать классическую рок-балладу о любви. То есть classic rock ballad about love. Через пару минут (не больше) нейросеть выдаёт нам сразу две версии песни — с женским и мужским вокалом. Она вообще выдаёт сразу по две версии — всегда, очень весомый плюс. И получается… вполне себе солидный уровень — такой классический припопсованный рокешник в духе 90-ых годов прошлого века. Вот один из вариантов — мужской:

Если честно, были приятно удивлены, поражены и даже сражены. Без каких-то костылей, в три минуты и с использованием всего нескольких английских слов вышел вполне себе готовый аудио продукт для использования где угодно. В озвучке романтической рекламы.  В фоновой музыке для свадебного видео. В подборке лучших эпизодов отдыха. И так далее.

Кстати, вам не кажется, что в самом начале голосовой части этого трека мужской вокал даже отчасти похож на известного американского армянина Сержа Танкяна, бывшего вокалиста System Of A Down и вполне успешного самостоятельного музыканта?))

Но сразу скажем — в ходе дальнейших тестов мы не смогли создать ни одного промпта с указанием какой-то реальной персоны. Например, сгенерировать с помощью нейросети песню в стиле Metallica или с голосом как у Хэтфилда не получится — нейронка ругается и говорит, вам «ай-яй-яй, так нельзя мной пользоваться, это ж почти дипфейк»!

Но где наша не пропадала. Всегда можно сделать «композицию в стиле трэш-метал и с хрипло-звонким голосом». Или как-то ещё поэкспериментировать — в результате выйдет если не точная копия любимой группы, то вполне себе приемлемое подобие.

А что там насчёт создания песен в Riffusion на русском?

Первая, вторая и третья попытки написать использовать «Рифффьюжн», чтобы написать песню про любовь на русском, получились полностью провальными. Вскоре стало понятно — опять же из-за неверного составления промпта.

Главный наш провал на этом — нейронка писала текст на английском, и хоть убейся. Эврика! А если поставить задачу на русском языке? То есть не song about love, Russian lyrics, как делали до того, а «песня про любовь на русском языке». В итоге формальный результат мы-таки получили — но больше именно формальный, чем реальный.

Ниже — одна из таких песен. Но можете не слушать даже, а просто прочитать дальше текст с общими оценками результатов работы в этом направлении.

Почему сложно назвать результат написания русскоязычной песни с использованием нейросети Riffusion успешным? Вот главные причины:

  • Текст пишется правильными русскими словами, но всё равно так, как будто это не русская лирика, а просто построчный перевод английского текста.
  • Наличие рифмы в тексте очень условное — говоря проще, если она и есть, это скорее случайность, чем хорошая работа нейросети.
  • В интонациях голосов — а мы делали и женский, и мужской вокал — местами отчетливо проскакивает гротескный британский акцент наподобие герцога Бэкингема из советского фильма «Три мушкетёра». ))) Или из плохого американского боевика с плохими русскими парнями — «Я тьебья помнью.»))) А иногда слова вообще произносятся как каша, буквально.

Вот примеры текстов, сгенерированных искусственным интеллектом. Мягко говоря, до идеала ещё работать и работать.

Без рифмы и даже без ритма:

Тихо падает снег за окном

Я сижу и смотрю на часы

Все слова, что хранила давно

Просятся наружу из тишины

Вот туповатый подстрочный перевод:

В тишине ночи

Я скажу тебе всё как есть

Сердце так стучит

Не могу эти чувства скрыть

В тишине ночи

И вишенка на торте — нейронка иногда сходит с ума пытается делать англо-русские тексты, как будто так и было задумано. А получается ещё хуже, чем в предыдущих версиях, полная аритмичная белиберда:

Прошлой ночью мело snowflakes softly

В наших руках время остановилось

Ты и я, следы в белом покрывале,

Твои глаза смотрят, мне не отпустить.

В моём сердце echo of first love,

Снег укроет следы, но не memories.

Так что создать хорошую песню с помощью Riffusion на русском языке пока не вышло. Но лиха беда начало — наверняка скоро ситуация изменится, подумали мы. Подумали — и тут же решили её сами изменить и улучшить.

Дело в том, что в Ruffusion есть ещё одна опция, не испробовать которую мы не могли — ей можно скормить свой вариант текста. Итак. Берём какой-нибудь стих и отдаём нашему нейронному композитору на сочинение мелодии и вокала. Хотелось понять не только то, как ИИ словит ритм, но и вообще — сможет ли понять, какой смысл вложен в стихи.

Не думая слишком долго, воткнули всем известные строки Сергея Есенина — «Да! Теперь решено — без возврата». Тем более, что и песня уже много лет есть на это стихотворение, прикольно будет сравнить.

Попросили сделать в нескольких вариантах — русский рок, рэп, хэви-метал с хриплым голосом. И если убрать несколько откровенных косяков с произношением (например, не старый пёс, а старый пес, плюс опять несколько порций каш вместо некоторых слов), то результат вообще выбил из колеи.  Вот здесь просим — реально послушайте, хотя бы минутку.

Рэпованно-гитарный стиль:

Блин, ну разве это не круто? С поправкой на то, что эту песню на русском сделала всё-такие нерусская нейросеть и всего за две минуты?

Между делом мы ещё попробовали создавать и другие музыкальные композиции — например, заставку для выпуска новостей. Как и при работе со всеми нейросетями, качество промпта здесь также оказалось решающим. С пятой-шестой попытки нам удалось создать вполне себе реальный, боевой джингл. Правда, он был длинный — несколько минут, но ведь это не проблема, обрезать всегда можно. Зато можно без склейки подзвучить целый новостной сюжет. Так что длина — скорее плюс, чем минус. Пусть лучше останется, чем не хватит.

Главные выводы из всего обзора нейросети Riffusion com

Нейронка Riffusion для создания музыки подходит очень хорошо — даже отлично. Чтобы не сильно загружать вас ещё более длинным текстом, добавим лишь, что при составлении правильных промптов вы можете работать с любыми жанрами вплоть до классической музыки. И работать вам будет по-настоящему просто — и ещё очень увлекательно. Сервис годны — заявляем ответственно.  И к тому же пока что полностью бесплатный. И все полученные треки в Riffision скачать тоже можно без каких-то ограничений — в один клик. А архив ваших экспериментов будет на всякий случай храниться в вашем личном кабинете — для этого надо просто зайти в раздел Library (библиотека то есть) слева вверху страницы.

Также здесь есть и другие инструменты для создания, редактирования и микширования аудиозаписей, так что вам совершенно точно не будет скучно. Мы очень надеемся, что наш опыт и обзор был для вас и интересен, и полезен. И что вы сможете развить его, занимаясь дальнейшим изучением этой платформы самостоятельно. Спасибо за внимание!

==
Если вам нравятся наши публикации, заходите также и в канал Лаборатории Контента в Telegram, там полезностей даже больше, чем на сайте 😉
Искренне ваша,
      Лаборатория контент-маркетинга Александра Алмиса.

Добавить комментарий