Midjourney V5 już jest - grafika generowana przez AI na nowym poziomie

Midjourney V5 is Out Now - Next Steps in Photorealistic Experience with AI Art

Ostatni przełom w AI, który mogłeś przegapić: bardzo oczekiwany Midjourney V5 jest już dostępny. Niezależne laboratorium badawcze wydało właśnie swoją najnowszą wersję słynnego generatora sztuki AI. Niektórzy już nazywają go „światem fotorealistycznych cudów”, jeśli chodzi o tworzenie zapierających dech w piersiach obrazów z podpowiedzi tekstowych. Cud czy nie, nowo wyszkolony model obiecuje znaczną poprawę w rozumieniu języka, dokładności i elastyczności stylistycznej. Wypróbujmy go razem i zobaczmy, co potrafi ta aktualizacja.

Na stronie Midjourney pojawiła się najnowsza wersja modelu generatora, która została opisana jako najbardziej spójna i oferująca wyższą rozdzielczość. W porównaniu z poprzednimi wersjami, Midjourney v5 zapewnia lepszą jakość oraz bardziej realistyczne efekty na generowanych obrazach. Nowy model jest ustawiony domyślnie, jednak użytkownicy mają możliwość skorzystania z poprzednich wersji Midjourney poprzez parametr –version lub –v, lub za pomocą polecenia /settings i wyboru odpowiedniej wersji modelu. Dzięki temu, możliwe jest uzyskanie zupełnie innych efektów dla tych samych zapytań, ponieważ każda z wersji wyróżnia się zupełnie innymi typami obrazów.

Efekty generowane przez nowy model są znakomite, a praca generatora staje się coraz bardziej szczegółowa i realistyczna, a coraz mniej opiera się na sztuce. Na Twitterze pojawił się post, w którym użytkownik przedstawił różnicę w grafikach wygenerowanych przez Midjourney v4 oraz Midjourney v5, co wskazuje na to, że najnowsza wersja zapewnia jeszcze lepsze wyniki.

Kolejny model AI – głębokiego uczenia

Spis treści

V5 to drugi model głębokiego uczenia od Midjourney , a prace nad nim trwały przez ostatnie pięć miesięcy. Twierdzi, że w porównaniu z poprzednikiem wykorzystuje zupełnie inną architekturę neuronową i nowe techniki estetyczne. Jak to ujęli deweloperzy: „Możesz usłyszeć, że jest scharakteryzowany jako nowo wyszkolony, większy mózg, że wie więcej, rozumie więcej lub słucha lepiej. Wszystkie te rzeczy są prawdziwe w przypadku V5.” Oczywiście, musieliśmy sami spróbować. I lo-and-behold, to wydanie czyni cuda, nawet jeśli to wciąż tylko test alfa.

Midjourney V5 już wyszedł – ale jak go używać?

Jak możesz dodać nowy model V5 do swojego workflow? Są dwa sposoby, aby to zrobić: możesz albo wpisać „/settings” w dowolnym kanale Discorda #newbies, a następnie wybrać „MJ wersja 5”. Albo – jeśli chcesz najpierw wypróbować – po prostu dodaj parametr „- v 5” na końcu swojej zachęty.

midjourney v5 jest już dostępny: jak włączyć go w swoim kanale discorda — Zrzut ekranu z bota Midjourney na Discordzie, podkreślający poprawne użycie parametru „v 5”

Poprawiona spójność, szczególnie w przypadku twarzy i kończyn

Jedną z największych zmian, na którą z niecierpliwością czekała społeczność Midjourney, był koniec z ludźmi o sześciu palcach. W nowym modelu zauważysz mniej plam chaosu, ponieważ posiada on znacznie więcej wiedzy na temat tego, jak radzić sobie z kończynami. Ponadto V5 powinien lepiej radzić sobie z generowaniem twarzy i oczu z najdrobniejszymi szczegółami. Przeprowadziliśmy kilka testów portretów poniżej i rzeczywiście, wyglądają one naprawdę niesamowicie.

midjourney v5 jest już dostępny: ulepszone fotorealistyczne portrety z poprawionymi twarzami i kończynami — Kilka eksperymentów z realistycznymi portretami.

To nie są prawdziwi ludzie! Szalone, prawda? A jednak, nie są bezbłędne. Na przykład na zdjęciu z modelką robiącą selfie w lustrze, zauważcie kilka poważnych problemów z odbiciami. Ręce grających chłopców również nie są idealne, ale to jak kreda i ser w porównaniu z poprzednim modelem Midjourney opartym na głębokim uczeniu. A nowy generator sztuki naprawdę potrafi liczyć do pięciu podczas tworzenia palców.

Fotorealizm jako główne ulepszenie

Jak widać powyżej, model V5 może zaoferować znacznie bardziej realistyczne obrazy w ogóle. W rzeczywistości, jeśli nie określisz stylu artystycznego, nazwiska artysty referencyjnego lub źródła mediów, otrzymasz domyślne ustawienie systemu, a wynik będzie wyglądał całkowicie fotorealistycznie. Podpowiedzi w nowej wersji są zaprojektowane tak, aby wyglądały jak zdjęcia, więc jeśli potrzebujesz czegoś bardziej abstrakcyjnego lub artystycznego, zalecamy dostosowanie słów.

Inną możliwością w dopracowaniu tego, jak Midjourney czyta twój opis tekstowy jest dodanie parametru „stylize N” na końcu podpowiedzi (gdzie N waha się od 0 (min) do 1000 (max)). Im niższa wartość, tym mniejszy wpływ będzie miał styl domowy AI na końcowy obrazek. Oznacza to, że jeśli potrzebujesz wygenerować obraz w stylu Vincenta van Gogha, spróbuj umieścić „- stylize 1000”, jak zrobiłem to w poniższym teście.

midjourney v5 is out now: jak wystylizować swój obrazek — Wynik żądania obrazu w stylu Vincenta van Gogha. Kredyt dla obrazu: stworzony z Midjourney V5 przez CineD

Patrząc na nasze eksperymenty, a także na wygenerowane obrazy od innych członków w poście społeczności Midjourney na kanale showcase, nie mogę się powstrzymać: są niesamowite. I bardzo przerażające. Czy nastąpi moment, w którym nikt nie będzie w stanie odróżnić prawdziwego zdjęcia od tego stworzonego przez sztuczną inteligencję? Chyba tylko czas pokaże.

Midjourney V5 już jest: wyższa detalizacja oraz poprawiona wydajność z podpowiadaniem

Niepokojące myśli na bok, inną deklarowaną cechą nowego modelu Midjourney jest jego zwiększona integralność. Istnieje większe prawdopodobieństwo, że szczegóły wygenerowanej sztuki wyjdą poprawnie, a ponadto V5 ma tendencję do reagowania na Twoje polecenia. Twórcy nazywają tę wersję „znacznie bardziej nieopiniotwórczą” niż V3 i V4. Dla uczciwego porównania, wziąłem mój stary prompt, którego użyłem do ostatniego artykułu związanego z Midjourneyem i podałem go do najnowszego wydania. Zobaczcie sami:

midjourney v5 is out now: side by side comparison of V4 and V5 — Po lewej: stare wyjście z V4. Po prawej: wynik tego samego podpowiedzi w nowym V5. Kredyty do obrazu: stworzony z Midjourney przez CineD

Wydaje się, że Midjourney może teraz produkować bardziej kontrolowane i przewidywane wyniki. Jednocześnie to ulepszenie oznacza, że może być trudniejszy w użyciu. Krótkie podpowiedzi mogą już nie działać tak dobrze jak wcześniej. W V5 deweloperzy sugerują pisanie zdań zamiast list i używanie bardziej wyraźnego tekstu opisującego to, co chcesz. Pomyśl o tym jak o bardzo krótkim zadaniu esejowym, które wszyscy musieliśmy od czasu do czasu skomponować w szkole.

Wyższa rozdzielczość i inne współczynniki proporcji

Zgodnie z obietnicą, piąta wersja Midjourneya oferuje dwukrotny wzrost rozdzielczości i może teraz tworzyć obrazy do 1024×1024. To na co należy zwrócić uwagę to fakt, że przycisk „upscale” działa w tym modelu inaczej. Wszystkie obrazy, które otrzymujesz z V5 są w maksymalnej jakości, więc ten przycisk po prostu oddziela twój wstępnie przeskalowany obraz od siatki. Docelowo powinna pojawić się możliwość generowania obrazów 2048×2048.

Kolejna ciekawa aktualizacja obejmuje szersze opcje proporcji obrazu. Wcześniej te niestandardowe nie były w ogóle obsługiwane. W nowym modelu można tworzyć znacznie szersze lub znacznie węższe rozmiary płótna i wypróbować dowolny współczynnik proporcji. O, to jest dokładnie to, na co liczyłem na moodboardach – teraz dostępne również w Cinemascope!

midjourney v5 jest już dostępny: nowe współczynniki proporcji — Przykład obrazu wygenerowanego w Cinemascope poprzez dodanie „-ar 21:9”

Wracają wagi obrazów

I na koniec chcę powiedzieć o funkcji wagi obrazu, która powraca w najnowszej wersji Midjourney. Jeśli używasz zdjęcia lub obrazu jako odniesienia, możesz teraz zwiększyć jego wagę za pomocą parametru „iw N”, gdzie N waha się od 0,5 do 2,0. Pozwól, że pokażę Ci jak to działa na przykładzie zdjęcia Jamie Lee Curtis odbierając jej Oscara za najlepszą rolę drugoplanową w zeszłym tygodniu. Wrzuciłem jej zdjęcie do bota Midjourney i poprosiłem, by wyobraził ją sobie jako piękną kosmitkę z innej planety. Umieściłem też na końcu „- iw 1.0”, abyśmy mogli jeszcze rozpoznać aktorkę. Oto jeden z wyników, które wymyśliła SI:

midjourney v5 is out now: reference image weight is back — Wygenerowany obraz na podstawie zdjęcia referencyjnego Jamie Lee Curtis

Ważne przypomnienie: jeśli wykorzystujesz stworzony obraz do jakichkolwiek celów innych niż moodboardy czy rozwijanie pomysłów (a zwłaszcza komercyjnych), upewnij się, że masz prawa do zdjęcia referencyjnego, jak również nie zapomnij o prawidłowym przypisaniu.

Midjourney V5: jakie są główne problemy?

Użytkownicy poprzednich wersji Midjourney będą musieli ponownie nauczyć się składni. Wspomniałem o tym wcześniej, ale myślę, że to ważna rzecz, o której należy pamiętać. W Discordzie trwa teraz wiele eksperymentów, ponieważ członkowie społeczności próbują dowiedzieć się, jak sformułować swoje prośby do modelu V5 tak poprawnie, jak to tylko możliwe.
Niektórzy użytkownicy zauważają, że V5 jest nieco wolniejszy od V4, co nie powinno być niespodzianką, ponieważ jest też zwiększona jakość i detalizacja.
I tak, jest to jeszcze świeżynka, a hype jest ogromny. Więc uważaj, że serwery mogą być przeciążone. Może pomóc płatna subskrypcja, która pozwala na bezpośredni czat z botem Midjourney. Albo po prostu bądź cierpliwy – warto.