Страница 1 из 2
onikodim
Мужики, может, кто на вскидку ссылку даст на прогу,
перегоняющую MP3 в 64-голосную полифонию для мобильника?

Последний раз редактировалось: onikodim (15 Января 2005 11:30), всего редактировалось 1 раз
Ded Mustdie?
MPG - это что???
если это музыкальный формат, то слабо представляю, как можно его перегнать в систему команд МИДИ... хотя такая програмка попадалась, но уж больно смешно на выходе получается Very Happy
wxp
Под MPG вы подразумеваете видеоклипы в формате MPEG?
Если же тут подразумевалась музыка в формате MP3 то это другой вопрос.....
onikodim
Простите за описку. Конечно не MPG, а MP3.
onikodim
Ded Mustdie? писал(а):

... хотя такая програмка попадалась, но уж больно смешно на выходе получается Very Happy


Если можно, то поподробнее.
GEN?
Перегнать МР3 (как и любой другой формат уже записанной многоголосой музыки) в формат МИДИ может только музыкант.
Сам посуди ? нужно выделить партии каждого инструмента из общей полифонии, а по каким критериям? Только человек, музыкант обладает избирательностью и может, скажем, выделить партию гобоя в общей группе деревянных духовых.
Ни одна программа пока на это не способна, во всяком случае сделать это корректно в сложной полифонии (лишь простую одноголосую мелодию).
onikodim
GEN писал(а):

Перегнать МР3 (как и любой другой формат уже записанной многоголосой музыки) в формат МИДИ может только музыкант.
Сам посуди ? нужно выделить партии каждого инструмента из общей полифонии, а по каким критериям? Только человек, музыкант обладает избирательностью и может, скажем, выделить партию гобоя в общей группе деревянных духовых.
Ни одна программа пока на это не способна, во всяком случае сделать это корректно в сложной полифонии (лишь простую одноголосую мелодию).


Что-то сомнительно, что вся полифония для мобильных - результат
труда музыкантов, а не перегон готовых звуковых файлов. A голос (вокал) на каком инструменте играют ?
Еще вопрос mmf-файлы чем от midi принципиально отличаются.
GEN?
Если речь идет о миди-файлах, то это всегда результат работы человека ? музыканта, аранжировщика, диджея, просто любителя и т.д. При этом он может пользоваться разными программами-аранжировщиками, самоиграйками, готовыми партиями ударных и т.д. Или в профессиональных программах Cakewalk, Cubase?
В любом случае результат можно получить в виде простого стандартного миди-файла, который более менее правдоподобно будет звучать со звуковыми модулями формата GM (128 определенных инструментов под своими номерами)
Ни одна программа пока выделить партитуру из готовой записи музыки не может. Почему ? я объяснял выше.
А миди-файлв в инете море - все известные и неизвестные группы и песни Smile Качество аранжировки и степень сходства с оригиналом ? очень разное, зависит от грамотности и трудолюбия автора.
Falcon[SD]
теоретически, в этом нет ничего невозможного!
realist
Falcon[SD]: и теоретически и практически перегнать звук из аналогового формата в цифровой АБСОЛЮТНО невозможно. не с ан.НОСИТЕЛЯ в цифровой, а именно из ан. ФОРМАТА в цифровой. в ан.формате звук разбит на мельчайшие кусочки и для каждого такого кусочка записывается грубо говоря громкость звука на каждой из слышимых человеком частот. Качество такой записи зависит от того, с какой точностью задаётся громкость и с каким шагом перебираются частоты. Примеры: CD-Audio, WAV (а значит и mp3 и иже с ними), виниловые пластинки и т.п. Главный плюс, который делает этот формат незаменимым - это его аналоговая (т.е. бесконечная) природа. В чём же бесконечность? в том, что в природе может существовать бесконечное множество различных звуков, т.к. оба параметра, задающие содержание аналогового звука являются бесконечными - можно задавать бесконечно точное значение громкости с бесконечно малым шагом частот. ЛЮБОЙ звук, который только может услышать человек, может быть записан в аналоговом формате, только с разным качеством. Цифровой формат - это конечное множество нот, разделённое на кон. множество дорожек, где каждой дорожке приписан 1 из конечного набора голосов. По сути, синтезатор (в котором только и можно создавать музыку в цифровом виде) содержит в себе конечный набор звуков, а при воспроизведении он накладывает некоторые из них на некоторые другие. но всего звуков, которые он может создать, всегда конечное число. Т.О. музыка в цифровом виде - это подмножество музыки в аналоговом виде. поэтому цифровую музыку можно перевести в аналоговый формат, но наоборот нельзя. предположим, в песне поёт мужчина. чтобы перевести это в цифровой формат, необходимо добавить в синтезатор все сочетания звуков, которые этот мужчина в принципе может издать, а это уже невозможно, пусть мы возьмём целиком слова, которые он поёт, но в следующей песне будут другие слова и т.д. а оттенки голоса? на земле 6 млрд. человек. как записать всё, что КАЖДЫЙ из них вообще способен издать, чтобы все оттенки тембра сохранились? короче говоря, всегда может появиться такой новый звук, который ещё не может быть записан в цифровом формате, но НЕ МОЖЕТ БЫТЬ звука, который было бы невозможно записать в аналоговом виде, и такого звука никогда не появится. При этом есть программы, которые вроде как переводят wav в midi, у меня есть одна такая. я конечно не знаю, на каких примерах её создатели эту прогу проверяли, но из всех песен, которые я её давал, получалось ТАКОЕ!!! ну, в общем, ничего общего у того, что было на входе, и что получилось на выходе. и это естественно! я думаю из 1 песни из 1000 ей может быть удастся выцарапать часть основного мотива, который будет передан совершенно другим инструментом, и то хлеб. так что это НЕВОЗМОЖНО!
Falcon[SD]
лет 20 назад вам бы очень авторитетно заявили, что фотоаппарата в мобильном телефоне быть не может, а если кто и сделает, это будет громоздкий, невостребованный агрегат. Very Happy

вопрос только во вложенной сумме денег. конечно, ожидать многого от программеров-энтузиастов наивно.

разложить стандартную песенку в полифонию вполне реально. посмотрим проще - есть диапазон голоса (около 1000 Гц), диапазон басов (500 Гц и менее), ударные можно выделить по ритмичности на низких частотах (300 Гц), все, что выше 5 кГц можно смело "оцифровывать" пищащими звуками.

проблема только в умении распознавать инструменты. здесь сгодится технология, аналогичная распознаванию голоса. это и есть самая сложная часть программы, для этого нужно вкладывать много $. однако, технология эта существует и хорошо работает на "дикторской", неслитной речи.

оцифровать в midi "что угодно" такая прога не сможет, но попсу будет щелкать легко.

что касается "бесконечного" многообразия звуков, то могу сказать, что возможности наших ушей и мозга не безграничны, вопрос только в дискретизации: 40 кГц для нас уже сливается в единый звук, никто не различит изменения тона звука, скажем, в 1/100 октавы, но это вполне реально оцифровать (не в midi, конечно). в midi можно перегнать почти любую мелодию, исполняемую на инструментах, записаных в таблицах миди, вопрос только финансирования такой программы. но она никому не нужна, поэтому качественного продукта скорее всего никогда не будет.
GEN?
Все смешалось в доме Облонских?Smile
Цифровая запись ? это WAV-файлы, МР3, аудио CD (компакт диск), MD (мини диск), DAT, SACD и т.д.
Аналоговая запись ? винил, кассета, пленка?
МИДИ ? набор команд для синтезатора, сэмплера, звукового модуля и т.д. ? т.е. ПАРТИТУРА в виде секвенции (последовательности) высот и длительностей нот, соответствий определенному инструменту, команд контроллеров, панорамы, громкости каждого миди-канала и т.д.
писал(а):

разложить стандартную песенку в полифонию вполне реально. посмотрим проще - есть диапазон голоса (около 1000 Гц), диапазон басов (500 Гц и менее), ударные можно выделить по ритмичности на низких частотах (300 Гц), все, что выше 5 кГц можно смело "оцифровывать" пищащими звуками.


Если бы все было так просто Smile
Диапазон голоса 100-10000 Гц и больше.
Как различить бочку и бас, особенно если их партии часто пересекаются? Как выделить другие низкочастотные инструменты в этом же частотном диапазоне?
Диапазон ударных вовсе не 300 Гц Smile И как выделить по формальным признакам, скажем, малый барабан, особенно в сложных ритмических рисунках? А альты, а томы?
Даже хай-хэт трудно формализовать и отделить, скажем, от арпеджиато насыщенного синтезатора.
Все это может сделать ТОЛЬКО человек, т.к. он владеет уникальным свойством ? избирательностью слуха, особенно тренированный человек, музыкант.
Возможно, все это покажется заумным теоретизированием Smile , но практические выводы очень просты:
1. Не может программа корректно выделить из готовой записи все партии инструментов.
2. Гораздо проще и быстрее это сделает человек. Опытному аранжировщику достаточно 5-10 минут для изготовления миди-файла попсовой вещицы с более-менее приемлемой достоверностью
3. Уже готовых миди-файлов в инете столько, что можно не заморачиваться. Если ты не музыкант, конечно...
realist
Falcon[SD]: мне казалось, что в прошлом посте я уже хорошо всё объяснил, но похоже, это не так. 1. Фотоаппарат в телефоне теоретически возможен, также как, скажем, телевизор в наручных часах - всё дело в элементной базе. а перевести музыку из ан.формата в цифровой нельзя В ПРИНЦИПЕ, как нельзя записать выражение множества с помощью символов подмножества. допустим, у нас есть множество точек, из которых мы можем составлять любые символы. если нас попросят записать китайский иероглиф, мы сразу же запишем его этими точками. а если мы имеем только набор десятичных цифр (составленных ИЗ ЭТИХ САМЫХ точек), мы сможем записать любое десятичное число, но вот произвольный китайский иероглиф мы уже записать не сможем. это ВООБЩЕ невозможно (хотя, возможно сущ-т несколько иероглифов, которые внешне напоминают дес. цифры). 2. насчёт диапазонов вы, уважаемый, меня очень извините, конечно, вы совсем профан. в качестве ликбеза сообщу, что у двух человекек, стоящих рядом, и тянущих два соседних полутона, голоса звучат совсем на разных частотах. поэтому даже в попсовой песне голос звучит в весьма обширном диапазоне (ради интереса можно запустить на WinAMPе песню, в которой есть только голос и посмотреть на диаграмму частот - чел переходит на чуть более низкую ноту и поднимаются уже другие столбики, те, что левее). а так как сейчас даже деревенская бабка применяет к своему голосу как минимум ревербератор и эхо, диапазон сразу же расширяется ещё больше. и это только голос! а большинство инструментов, выдавая одну ноту, испускают набор звуков чуть ли не от 100 до 10000 Гц. Даже в самой попсе 99% инструментов обширно пересекаются! 3. Насчёт прог по распознаванию голоса. Эти проги напоминают мне системы распознования текста с картинки. есть КОНЕЧНОЕ число символов, и даже в них они частенько путаются. а может ли существовать программа, которая должна будет узнать, что изображено на картине? Конечно, нет. т.к. я могу нарисовать, скажем, собаку так, что не каждый человек догадается. типа абстракционизм. и что? кстати, речь тоже распознаётся не ахти. 4. Никогда не будет проги, которая сможет "щёлкать" попсу. 5. Здрасьте, приехали. "Не в midi" - это сильно! А во что ещё можно оцифровать? в этом то и вопрос, что в midi!

GEN: Мы говорим не про способ записи, т.е. тип носителя, а про формат музыки. на кассету (аналоговый носитель) можно записать прогу для компа (цифровой формат), а на винчестер (цифровой носитель) можно записать, скажем, голос с микрофона (аналоговый формат). Правда? Smile
GEN?
realist писал(а):

GEN: Мы говорим не про способ записи, т.е. тип носителя, а про формат музыки. на кассету (аналоговый носитель) можно записать прогу для компа (цифровой формат), а на винчестер (цифровой носитель) можно записать, скажем, голос с микрофона (аналоговый формат). Правда? Smile


Не совсем так.
Есть цифровой формат звукозаписи и есть аналоговый.
Дело действительно не в носителе - скажем DAT, 8-ми канальный ADAT - физически это кассеты (с лентой внутри), но запись цифровая, т.е. аналоговый сигнал например с микрофона преобразуется в цифру с помощью конвертера (АЦП) и записывается. Воспроизводится с помощью ЦАП.
Разница с аналогом скажем в том, что цифру можно копировать без потерь ("бит в бит"), аналог - нет. (Правда это относится к "честной" цифре - 16 бит44,1(48 ) кГц, 2496 БЕЗ КОМПРЕССИИ. Чего не скажешь об МР3 и мини-диске)

На хард-диск компа запись производится ТОЛЬКО в цифровом формате (WAV, mp3 и др.)

А МИДИ - не есть формат звукозаписи, это набор команд для синтезатора, партитура.
Geol
Позвольте вмешаюсь.
Для какого телефона это необходимо?
У меня ыч1 и пониает wavы перегоняется многими прогами.
Пробовали для нокии в миди перегонять получалось. Правда не 64голосная, но тем не менее.
Правда давно это было и не помню из какого исходного формата. Возможно и не из мп3. Но точно помню что мелодии стинга и РХЧП я жене на мобильный ставил. 64 голосная это для корейцев?
YuRock
Искал прогу mp3 -> midi очень долго и не нашел... midi - набор звуков-нот, mp3 - это как музыка так и слова... Возможно, если такая программа существует, то она сможет перевести музыку из mp3 в midi но не слова, или звучать будет ужасно. 8-)
Может проще купить телефон с поддержкой mp3? Very Happy
Falcon[SD]
realist, ты страшный зануда!!! Very Happy

если рассуждать твоей логикой до конца, то невозможно будет оцифорвать какой-либо звук вообще! конечно, как же можно непрерывное описать дискретным?!! Very Happy любое множество можно описать подмножеством с приемлемой потерей качества. например, ускоренным во много раз воспроизведение midi можно синтезировать любые звуки. ну это так, теоретически. ни один идиот этим заниматься не будет.

что касается midi, то речь не идет о доскональной оцифровке сложных оперных композиций, а о разложении в инструменты midi попсовых мелодий. не вижу в этом ничего нереального. то, что с этим плохо справляютс ясуществующие программы говорит только о том, что в эту область не вкладывали деньги.

моя мысль была в том, что можно тупо по АЧХ wav-файла составить midi-файл с приемлемой для мобильного телефона достоверностью, не более.

если вы видели когда-нибудь ачх в динамике, то должны знать, что по ней очень хорошо видно "вступление" инструментов, голоса. программа распознавания может быть построена по нескольким принципам, например:

- по ачх - привязать наиболее подходящие по звучанию инструменты midi в соответствующих частотах, основываясь на уровне громкости на данной частоте. это наиболее простой и неэффективный способ. но в попсе должен дать на выходе узнаваемую midi-мелодию.

- по фонограмме. как компьютеры играют в шахматы? по библиотекам игр просчитывают возможные исходы игры для каждого хода. иначе расчет всех комбинаций занял бы слишком много времени и памяти. так же и программу можно оснастить библиотекой записями АЧХ наиболее распространенных инструментов и звуков. проанализировать ачх музкального фрагмента не сложно, программа легко выделит на графике характерную АЧХ инструмента (как это делает человек) и заменит его наиболее подходящим инструментом midi. разработка такой программы - очень большая работа, требующая больших средств, но это совершенно реально. для большинства композиций этот метод должен дать хороший результат. аналогичный подход применялся в первых "распознавалках" текста, потом появились более совершенные методы: человеческий ум невероятно изворотлив, когда его хорошо стимулируют.

и прекратите мне рассказывать о компьютерных форматах и звуках. я программист и инженер-акустик по образованию. я знаю все как минимум не хуже вас. Very Happy
realist
Falcon[SD]: считаю, что дискуссию по этому поводу можно закрывать, т.к. в общем и целом мы друга друга поняли. невозможно описать непрерывное дискретным, перевести звук из аналогового формата в цифровой, и это не вызывает сомнений. что касается отдельных программ-ВЫДИРАЛОК КУСОЧКОВ основного мотива, кои и сейчас есть, но плохо работают, то моё субъективное мнение, что они очень нескоро смогут давать приемлимый результат хотя бы в 10% случаев, хотя ЭТО, конечно, возможно.
GEN: разница, определяемая как возможность переписать что-то без потерь - это, как раз, и есть разница между типами НОСИТЕЛЕЙ, т.к. именно из-за того, что носитель аналоговый и невозможно гарантировать 100%-правильное считывание с него данных с первого прочтения (даже если читать цифру). как пример, можно вспомнить, как раньше компы загружались с кассет. я так делал. много раз. с первого раза никогда не загружался, как минимум с третьего, как максимум с шестого. при этом происходили сбои в чтении цифровых данных, обусловленные аналоговой природой носителя. т.е. данные цифровые, а переписать сразу бит в бит не получается. почему? как же "цифру можно копировать без потерь"? потому что носитель аналоговый. а формат звука никак с этим не связан. и в комп записываются разные форматы - и аналоговые и цифровые, но все они лежат на цифровом носителе - винте, ПОЭТОМУ их можно без потерь переписать на другой цифр.носитель. Кстати, я догадываюсь, отчего некоторые люди путаются в этих терминах: когда нечто переписывают с анал. носителя на цифровой (скажем, музыку с кассеты на винт), этот процесс называют оцифровкой, и хотя цифровым становится носитель, а данные остаются анал-ми, само слово оцифровка, вероятно, сбивает.
GEN?
realist писал(а):

Кстати, я догадываюсь, отчего некоторые люди путаются в этих терминах: когда нечто переписывают с анал. носителя на цифровой (скажем, музыку с кассеты на винт), этот процесс называют оцифровкой, и хотя цифровым становится носитель, а данные остаются анал-ми, само слово оцифровка, вероятно, сбивает.


Еще раз: есть форматы звукозаписи - цифровой и аналоговый.
Оцифровка - перевод аналогового сигнала в цифровой формат (с битностью 16 или 24 по вертикали и частотой дискретизазии 44,1 кГц, 48 кГц или 96 кГц по горизонтали) с помощью АЦП.
Соответственно запись на винте - только в цифровом формате.
realist
может, так будет понятнее: оцифровка меняет физическую природу сигнала (как он хранится на носителе), можно назвать её физическим форматом. а то, как записывается именно содержимое, как оно кодируется - это логическая природа (причём не сигнала, а данных, в данном случае звука). посему на винте все сигналы имеют цифровую физическую природу, но данные могут кодироваться (логика) в любом формате. ну, пришли к консенсусу?
Editor
Есть такая прога из любого формата WAV. MP-3 сделает миди Только результат дерьмо ПРОВЕРИЛ на себе.
Я ее нашел на МИДИ.ру Потом грохнул нафиг Не поверил я людям с тамошнего форума, что ничего хорошего не выйдет.
Идеология работы проста
Береш любой звуковой файл и загоняеш в прогу.
Потом говориш проге: создать МИДИ дорожку например ударных, настраиваеш чувствительность и порог и вперед, для каждого инстумента. Многократно сканируеш и создаеш дорожки МИДИ
Потом в подходящей проге типа КУБЭЙС объединяеш и редактируеш
Мотовня страшно долгая. Результат совершенно непредсказуем и далек от исходного файла
Для вокала дорожки нет
Ded Mustdie?
realist писал(а):

Кстати, я догадываюсь, отчего некоторые люди путаются в этих терминах: когда нечто переписывают с анал. носителя на цифровой (скажем, музыку с кассеты на винт), этот процесс называют оцифровкой, и хотя цифровым становится носитель, а данные остаются анал-ми, само слово оцифровка, вероятно, сбивает.


Аналоговые данные на цифровом носителе???? это как? примерчик, плизз...
Кстати, тут кто-то упоминал, что Аудио-СД - это "честная" цифра, без компрессии, к сожалению сам формат PCM уже является компрессией, хоть и вполне приличного качества, но компрессия... от этого только ещё больше жаль поклонников мп3, с пеной у рта доказывающих преимущество оного перед Аудио-сд Very Happy
а отличие МИДИ, как уже говорилось, заключается в том, что файл МИДИ содержит лишь данные о том, когда, какому иснтрументу сыграть ту или иную ноты... и ессно, без наличия инструментов (сэмплов) играть не будет... а ещё сэмплы бывают разные, потому один и тот же файл звучит на разных компах, телефонах и т.д. по-разному...
GEN?
PCM - звук несжатый (например, DD - сжатие 1:11, DTS - сжатие 1:3)
Вот какие надписи встречаются на DVD дисках:
?Disc is encoded with an uncompressed PCM soundtrack for optimum stereo fidelity?

Цитирую: "PCM (Pulse-Code Modulation) ? поток линейно оцифрованных значений амплитуды звука"
Т.е. цифровая запись (обычного стандарта 16 бит, 44,1 кГц) на CD, DATe, на старых U-matic, DASH? именно является самой ?честной?.
В отличии от всяких компрессированных (сжатых) мр3 и мини-дисков.

В остальном согласен.
Ded Mustdie?
Ну ДВД в данном случае вообще некорректно упоминать... это всего лишь носитель... ессно, для лучшего качества будет применяться РСМ, потому что на данный момент (с оговоркой) это лучший кодек для аудио из стандартизированных и общедоступных... возможно, в данном контексте я неверно применил слово компрессия... но надеюсь, ты же не думаешь, что в студиях матрицы пишутся в весьма бледном РСМ???
об оговорке: в принципе уже доступен формат ДВД-Аудио...он, конечно не будет применяться для кино, но вот музыка будет, а параметры там, как миминум вдвое шире СД-ишных :cool:
GEN?
Да, формат 24 бит, 96 кГц активно ипользуется при записи на студиях, правда сводить приходится все равно пока в обычный 16х44,1.
На конечных носителях музыки 24х96 пока не много, но будущее конечно за ним.
Самое смешное, что на концертах у нас все работают с ущербного в общем-то мини-диска Smile
Новая тема Ответить на тему
Показать сообщения:
Страница 1 из 2
Перейти:
Информация по иконкам и возможностям

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы можете вкладывать файлы
Вы можете скачивать файлы