Paragraphica, czyli jak sztuczna inteligencja „na ślepo” fotografuje świat

paragraphica (źródło: bjoernkarmann.dk)

paragraphica (źródło: bjoernkarmann.dk)

Jest coś magicznego w momencie, kiedy wciskasz spust migawki aparatu. W jednej chwili zapisujesz kawałek rzeczywistości, który stanie się częścią twojego życia na zawsze. A może moglibyśmy zrobić to na zupełnie nowy sposób? Z pomocą Paragraphica, kamery wykorzystującej sztuczną inteligencję do przekształcania tekstu w obraz, zaczynamy doświadczać świata na zupełnie innym poziomie.

Jak Działa Paragraphica?

Ten innowacyjny gadżet działa zarówno jako fizyczny prototyp, jak i wirtualna kamera, którą możesz wypróbować. Wizjer aparatu wyświetla opis Twojej aktualnej lokalizacji w czasie rzeczywistym, a po naciśnięciu spustu migawki kamera tworzy scyntygraficzne przedstawienie tego opisu. Aparat działa, zbierając dane z lokalizacji za pomocą otwartych API, wykorzystując adres, pogodę, porę dnia i pobliskie miejsca.

Analizując te punkty danych, Paragraphica komponuje akapit, który szczegółowo przedstawia aktualne otoczenie i chwilę. Następnie, za pomocą AI konwertującej tekst na obraz, kamera przekształca go w „zdjęcie”. Ale wynik nie jest tylko migawką. To skomplikowane i subtelne odzwierciedlenie miejsca, w którym się znajdujesz, i być może tego, jak model AI je „widzi”.

https://oiot.pl/wp-content/uploads/2023/06/paragraphica.mp4
Paragraphica (źródło: bjoernkarmann.dk)

Kamera wykorzystująca inne AI

Podobnie jak nornica gwiazdkowata, która żyje i poluje pod ziemią, znajdując światło, urządzenie pozwala na „widzenie” świata poprzez inne perspektywy. Używając danych lokalizacyjnych i syntez obrazów AI, dostarcza głębszego wglądu w istotę chwili poprzez perspektywę innych inteligencji.

Tak jak w tradycyjnej kamerze, znajdują się tu trzy pokrętła. Pierwsze kontroluje promień (metry) obszaru, który kamera przeszukuje pod kątem miejsc i danych, podobnie jak długość ogniskowej w obiektywie. Drugie działa na zasadach zbliżonych do ziarna filmu, generując szum dla procesu dyfuzji obrazu AI. Trzecie pokrętło kontroluje skalę wskazówek. Zwiększanie ich sprawia, że sztuczna inteligencja śledzi akapit dokładniej.

Trzy pokrętła (źródło: bjoernkarmann.dk)

Paragraphica korzysta z technologii Raspberry Pi 4, 15-calowego ekranu dotykowego, obudowy wydrukowanej w 3D i niestandardowej elektroniki. Do stworzenia aplikacji webowej służącej do komunikacji między aparatem a wieloma API użyto platformy Noodl. Dzięki temu jest możliwe generowanie na podstawie lokalizacji zarówno tematu, jak i samego obrazu. Wielką wartością urządzenia jest to, że przekracza granice tradycyjnej fotografii, dając nam nie tylko obraz, ale i głębsze zrozumienie tego, co reprezentuje.

Exit mobile version