w

Midjourney V5 już jest – grafika generowana przez AI na nowym poziomie

Midjourney V5 is Out Now - Next Steps in Photorealistic Experience with AI Art

Ostatni przełom w AI, który mogłeś przegapić: bardzo oczekiwany Midjourney V5 jest już dostępny. Niezależne laboratorium badawcze wydało właśnie swoją najnowszą wersję słynnego generatora sztuki AI. Niektórzy już nazywają go „światem fotorealistycznych cudów”, jeśli chodzi o tworzenie zapierających dech w piersiach obrazów z podpowiedzi tekstowych. Cud czy nie, nowo wyszkolony model obiecuje znaczną poprawę w rozumieniu języka, dokładności i elastyczności stylistycznej. Wypróbujmy go razem i zobaczmy, co potrafi ta aktualizacja.

Na stronie Midjourney pojawiła się najnowsza wersja modelu generatora, która została opisana jako najbardziej spójna i oferująca wyższą rozdzielczość. W porównaniu z poprzednimi wersjami, Midjourney v5 zapewnia lepszą jakość oraz bardziej realistyczne efekty na generowanych obrazach. Nowy model jest ustawiony domyślnie, jednak użytkownicy mają możliwość skorzystania z poprzednich wersji Midjourney poprzez parametr –version lub –v, lub za pomocą polecenia /settings i wyboru odpowiedniej wersji modelu. Dzięki temu, możliwe jest uzyskanie zupełnie innych efektów dla tych samych zapytań, ponieważ każda z wersji wyróżnia się zupełnie innymi typami obrazów.

Efekty generowane przez nowy model są znakomite, a praca generatora staje się coraz bardziej szczegółowa i realistyczna, a coraz mniej opiera się na sztuce. Na Twitterze pojawił się post, w którym użytkownik przedstawił różnicę w grafikach wygenerowanych przez Midjourney v4 oraz Midjourney v5, co wskazuje na to, że najnowsza wersja zapewnia jeszcze lepsze wyniki.

Kolejny model AI – głębokiego uczenia

Spis treści

V5 to drugi model głębokiego uczenia od Midjourney , a prace nad nim trwały przez ostatnie pięć miesięcy. Twierdzi, że w porównaniu z poprzednikiem wykorzystuje zupełnie inną architekturę neuronową i nowe techniki estetyczne. Jak to ujęli deweloperzy: „Możesz usłyszeć, że jest scharakteryzowany jako nowo wyszkolony, większy mózg, że wie więcej, rozumie więcej lub słucha lepiej. Wszystkie te rzeczy są prawdziwe w przypadku V5.” Oczywiście, musieliśmy sami spróbować. I lo-and-behold, to wydanie czyni cuda, nawet jeśli to wciąż tylko test alfa.

Midjourney V5 już wyszedł – ale jak go używać?

Jak możesz dodać nowy model V5 do swojego workflow? Są dwa sposoby, aby to zrobić: możesz albo wpisać „/settings” w dowolnym kanale Discorda #newbies, a następnie wybrać „MJ wersja 5”. Albo – jeśli chcesz najpierw wypróbować – po prostu dodaj parametr „- v 5” na końcu swojej zachęty.

midjourney v5 jest już dostępny: jak włączyć go w swoim kanale discorda
Zrzut ekranu z bota Midjourney na Discordzie, podkreślający poprawne użycie parametru „v 5”

Poprawiona spójność, szczególnie w przypadku twarzy i kończyn

Jedną z największych zmian, na którą z niecierpliwością czekała społeczność Midjourney, był koniec z ludźmi o sześciu palcach. W nowym modelu zauważysz mniej plam chaosu, ponieważ posiada on znacznie więcej wiedzy na temat tego, jak radzić sobie z kończynami. Ponadto V5 powinien lepiej radzić sobie z generowaniem twarzy i oczu z najdrobniejszymi szczegółami. Przeprowadziliśmy kilka testów portretów poniżej i rzeczywiście, wyglądają one naprawdę niesamowicie.

midjourney v5 jest już dostępny: ulepszone fotorealistyczne portrety z poprawionymi twarzami i kończynami
Kilka eksperymentów z realistycznymi portretami. 

To nie są prawdziwi ludzie! Szalone, prawda? A jednak, nie są bezbłędne. Na przykład na zdjęciu z modelką robiącą selfie w lustrze, zauważcie kilka poważnych problemów z odbiciami. Ręce grających chłopców również nie są idealne, ale to jak kreda i ser w porównaniu z poprzednim modelem Midjourney opartym na głębokim uczeniu. A nowy generator sztuki naprawdę potrafi liczyć do pięciu podczas tworzenia palców.

Fotorealizm jako główne ulepszenie

Jak widać powyżej, model V5 może zaoferować znacznie bardziej realistyczne obrazy w ogóle. W rzeczywistości, jeśli nie określisz stylu artystycznego, nazwiska artysty referencyjnego lub źródła mediów, otrzymasz domyślne ustawienie systemu, a wynik będzie wyglądał całkowicie fotorealistycznie. Podpowiedzi w nowej wersji są zaprojektowane tak, aby wyglądały jak zdjęcia, więc jeśli potrzebujesz czegoś bardziej abstrakcyjnego lub artystycznego, zalecamy dostosowanie słów.

Inną możliwością w dopracowaniu tego, jak Midjourney czyta twój opis tekstowy jest dodanie parametru „stylize N” na końcu podpowiedzi (gdzie N waha się od 0 (min) do 1000 (max)). Im niższa wartość, tym mniejszy wpływ będzie miał styl domowy AI na końcowy obrazek. Oznacza to, że jeśli potrzebujesz wygenerować obraz w stylu Vincenta van Gogha, spróbuj umieścić „- stylize 1000”, jak zrobiłem to w poniższym teście.

midjourney v5 is out now: jak wystylizować swój obrazek
Wynik żądania obrazu w stylu Vincenta van Gogha. Kredyt dla obrazu: stworzony z Midjourney V5 przez CineD

Patrząc na nasze eksperymenty, a także na wygenerowane obrazy od innych członków w poście społeczności Midjourney na kanale showcase, nie mogę się powstrzymać: są niesamowite. I bardzo przerażające. Czy nastąpi moment, w którym nikt nie będzie w stanie odróżnić prawdziwego zdjęcia od tego stworzonego przez sztuczną inteligencję? Chyba tylko czas pokaże.

Midjourney V5 już jest: wyższa detalizacja oraz poprawiona wydajność z podpowiadaniem

Niepokojące myśli na bok, inną deklarowaną cechą nowego modelu Midjourney jest jego zwiększona integralność. Istnieje większe prawdopodobieństwo, że szczegóły wygenerowanej sztuki wyjdą poprawnie, a ponadto V5 ma tendencję do reagowania na Twoje polecenia. Twórcy nazywają tę wersję „znacznie bardziej nieopiniotwórczą” niż V3 i V4. Dla uczciwego porównania, wziąłem mój stary prompt, którego użyłem do ostatniego artykułu związanego z Midjourneyem i podałem go do najnowszego wydania. Zobaczcie sami:

midjourney v5 is out now: side by side comparison of V4 and V5
Po lewej: stare wyjście z V4. Po prawej: wynik tego samego podpowiedzi w nowym V5. Kredyty do obrazu: stworzony z Midjourney przez CineD

Wydaje się, że Midjourney może teraz produkować bardziej kontrolowane i przewidywane wyniki. Jednocześnie to ulepszenie oznacza, że może być trudniejszy w użyciu. Krótkie podpowiedzi mogą już nie działać tak dobrze jak wcześniej. W V5 deweloperzy sugerują pisanie zdań zamiast list i używanie bardziej wyraźnego tekstu opisującego to, co chcesz. Pomyśl o tym jak o bardzo krótkim zadaniu esejowym, które wszyscy musieliśmy od czasu do czasu skomponować w szkole.

Wyższa rozdzielczość i inne współczynniki proporcji

Zgodnie z obietnicą, piąta wersja Midjourneya oferuje dwukrotny wzrost rozdzielczości i może teraz tworzyć obrazy do 1024×1024. To na co należy zwrócić uwagę to fakt, że przycisk „upscale” działa w tym modelu inaczej. Wszystkie obrazy, które otrzymujesz z V5 są w maksymalnej jakości, więc ten przycisk po prostu oddziela twój wstępnie przeskalowany obraz od siatki. Docelowo powinna pojawić się możliwość generowania obrazów 2048×2048.

Kolejna ciekawa aktualizacja obejmuje szersze opcje proporcji obrazu. Wcześniej te niestandardowe nie były w ogóle obsługiwane. W nowym modelu można tworzyć znacznie szersze lub znacznie węższe rozmiary płótna i wypróbować dowolny współczynnik proporcji. O, to jest dokładnie to, na co liczyłem na moodboardach – teraz dostępne również w Cinemascope!

midjourney v5 jest już dostępny: nowe współczynniki proporcji
Przykład obrazu wygenerowanego w Cinemascope poprzez dodanie „-ar 21:9” 

Wracają wagi obrazów

I na koniec chcę powiedzieć o funkcji wagi obrazu, która powraca w najnowszej wersji Midjourney. Jeśli używasz zdjęcia lub obrazu jako odniesienia, możesz teraz zwiększyć jego wagę za pomocą parametru „iw N”, gdzie N waha się od 0,5 do 2,0. Pozwól, że pokażę Ci jak to działa na przykładzie zdjęcia Jamie Lee Curtis odbierając jej Oscara za najlepszą rolę drugoplanową w zeszłym tygodniu. Wrzuciłem jej zdjęcie do bota Midjourney i poprosiłem, by wyobraził ją sobie jako piękną kosmitkę z innej planety. Umieściłem też na końcu „- iw 1.0”, abyśmy mogli jeszcze rozpoznać aktorkę. Oto jeden z wyników, które wymyśliła SI:

midjourney v5 is out now: reference image weight is back
Wygenerowany obraz na podstawie zdjęcia referencyjnego Jamie Lee Curtis

Ważne przypomnienie: jeśli wykorzystujesz stworzony obraz do jakichkolwiek celów innych niż moodboardy czy rozwijanie pomysłów (a zwłaszcza komercyjnych), upewnij się, że masz prawa do zdjęcia referencyjnego, jak również nie zapomnij o prawidłowym przypisaniu.

Midjourney V5: jakie są główne problemy?

  • Użytkownicy poprzednich wersji Midjourney będą musieli ponownie nauczyć się składni. Wspomniałem o tym wcześniej, ale myślę, że to ważna rzecz, o której należy pamiętać. W Discordzie trwa teraz wiele eksperymentów, ponieważ członkowie społeczności próbują dowiedzieć się, jak sformułować swoje prośby do modelu V5 tak poprawnie, jak to tylko możliwe.
  • Niektórzy użytkownicy zauważają, że V5 jest nieco wolniejszy od V4, co nie powinno być niespodzianką, ponieważ jest też zwiększona jakość i detalizacja.
  • I tak, jest to jeszcze świeżynka, a hype jest ogromny. Więc uważaj, że serwery mogą być przeciążone. Może pomóc płatna subskrypcja, która pozwala na bezpośredni czat z botem Midjourney. Albo po prostu bądź cierpliwy – warto.
AI ewoluuje na naszych oczach, całkiem nedawno wyszedł nowy Chat GPT 4 

Boję się pomyśleć co będzie za 5 lat w sferze pracy w Internecie i co będzie potrafić wytrenowane AI poprzez modele neuronowe sztucznej inteligencji.

Co myślisz?

Komentarze

Dodaj komentarz

Ładowanie…

0
Veteran

Napisane przez admin

Content AuthorGallery MakerStory MakerImage MakerVideo MakerYears Of MembershipEmoji AddictUp/Down Voter
5 najważniejszych rzeczy, które należy wiedzieć o GPT-4

Sztuczna inteligencja na nowym poziomie – Chat GPT-4 już jest!

revolut app

Revolut – zarabianie, szybki kredyt, krypto