vlaaing peerd schreef op donderdag 13 juni 2024 @ 13:33:
[...]
Leuke test, heb totzover alleen de eerste attempt geluisterd. Suno lijkt wat meer een logischer gevolg erop te maken, en klinkt als menselijke muziek, maar voorspelbaar en niet verassend.
Udio kon ik niet volgen, het zit in de toonladder, het klopt, maar geen logische lijn.
Jouw attempt laat meteen zien dat een mens beter verassendere wendingen eraan kan geven. Na de eerste phrase komt er iets wat past, maar niet meteen het "verwachtte" doet.
Als je de machine learning van een LLM erbij pakt, dan zie je dat taalmodellen gebaseerd zijn op de meest voorkomende output die mensen in een normaal gesprek geven, AI muziekgenerators lijken dat ook te doen, terwijl muziek natuurlijk een veel creatievere aangelegenheid is dan een gesprek die vol logica moet zitten.
Uiteindelijk zal AI muziek nog wel beter worden, en vraag me af wat dit voor rol gaat spelen in echte muziekproductie.
Ik gebruik het momenteel in al mijn muziek productie om van te samplen. Je kunt namelijke naar zowel suno en udio je eigen .wav of mp3 uploaden. En wat je van hun terug krijgt kun je stem splitten met Ultimate Vocal Remover. That werk tegenwoordig zo gigantisch goed, da's ongelooflijk.
Neem bijvoorbeeld Daft Punk Something About Us
bass
drums
wurli
vocals
En dat is met de standard settings, je kunt best nog wel wat artifacts horen maar als ik nu een week tijd zou nemen om met verschillende model te spelen en dan wat post processing te doen, dan krijg je toch echt wel iets wat heel dicht tegen de orginele opname aan zit. En dit soort machine learning zal ik de toekomst nog veel beter worden.
En die artifacts kun je heel makkelijker verbergen in een nieuwe mix. Maar ik drijf af.
Je kunt dus je eigen stems uploaden en suno en udio er op los laten, het resultaat weer splitten. En zo heb je toch toegang tot een oneindige sample machine die zowel audio als text based is. Ken jij een VST waar je een sample kunt droppen en dan zoek hij het dichtsbijzijnste geluidje? Die zijn er volgens mij ook wel. Maar dit werk nog een stap hoger. Wat ik momenteel heel vaak doe is dit. Ik heb een drum loop die ik heb gemaakt. Bijvoorbeeld deze slicing van de amen break.
Die upload ik dan naar sudo en udio, en dan maak ik daar laten we zeggen 20 remixen van. Ik split die zodat ik alleen drums heb en dan kan ik het orgineel en de remix samen voegen. Op die manier krijg je toch al heel gemakkelijk een veel voller sound.
Je kunt nog verder gaan. Upload je eigen half afgewerkt nummer, udio en suno maken er een heel nummer van. Download het, split de stems. Gebruik melodyne DNA om van de piano stem naar midi te gaan. Spendeerd 4 uur om je midi schoon te maken. Pak nu je eigen piano VST, nu heb je wat suno/udio heeft gemaakt maar in hoge kwaliteit en zonder artifacts.
En dat kan heel nuttig zijn als je vast zit met een nummer en het echt af wil maken. Ze kunnen je makkelijk helpen om verder te komen tot je niet meer vast zit. Ze makken de brug voor je, en dan kun je zelf weer verder.
Of genre mixen. Starte met jazz, dan vragen om dead metal. Het eind resultaat slaat nergens op. Afschuwelijk maar bij die overgang zit wel ff een hele rare bijzondere sample. Die knip je er uit, en dan heb een stukje audio dat echt buitenaard klinkt. En dat's gewoon tof. Om je te laten inspireren of om in je tracks te gebruiken.
En dan de kicker. Als je geen vocalists hebt en zelf niet kunt zingen en je kunt ze ook niet betalen. Nu kun je toch redelijke hoge kwaliteit vocals in je eigen muziek hebben met udio. Ja het zal wel even duren voor dat je die workflow hebt uitgevogeld om die vocals op je EIGEN muziek te krijgen, en dat ga ik nu ook hier niet uitleggen. (eerst zelf een groote zooi tracks er mee makken.)
En dan heb ik het alleen nog over de audio based models.
De midi based models, die zijn er nog nauwelijks. OpenAI heeft musenet gestopt. FL studio en de andere DAW's zijn er wel mee bezig geweest en die hebben bijna allemaal al AI chord generators ingebouwd maar die zijn echt niet goed.
Maar het is een kwestie van tijd voor iemand aan database maakt met hoge kwaliteit midi, en dan echt elke score die ooit geschreven is (en goed) een goede pretrainer bouwt en dan een 100B parameter midi model bouwt. En als je die 3 akkoorden geeft en wat me je temperatuur speelt dat die je af en toe een vierde akkoord geven en je gaat denken: knettergek, dit klinkt rete goed.
Dat is er nog niet maar zit er wel aan te komen.
Maar tot dan kan ik zeggen dat ik als componist nog steeds een koning ben.