paragraphica (źródło: bjoernkarmann.dk)
paragraphica (źródło: bjoernkarmann.dk)

Paragraphica, czyli jak sztuczna inteligencja „na ślepo” fotografuje świat

Jest coś magicznego w momencie, kiedy wciskasz spust migawki aparatu. W jednej chwili zapisujesz kawałek rzeczywistości, który stanie się częścią twojego życia na zawsze. A może moglibyśmy zrobić to na zupełnie nowy sposób? Z pomocą Paragraphica, kamery wykorzystującej sztuczną inteligencję do przekształcania tekstu w obraz, zaczynamy doświadczać świata na zupełnie innym poziomie.

Jak Działa Paragraphica?

Ten innowacyjny gadżet działa zarówno jako fizyczny prototyp, jak i wirtualna kamera, którą możesz wypróbować. Wizjer aparatu wyświetla opis Twojej aktualnej lokalizacji w czasie rzeczywistym, a po naciśnięciu spustu migawki kamera tworzy scyntygraficzne przedstawienie tego opisu. Aparat działa, zbierając dane z lokalizacji za pomocą otwartych API, wykorzystując adres, pogodę, porę dnia i pobliskie miejsca.

Analizując te punkty danych, Paragraphica komponuje akapit, który szczegółowo przedstawia aktualne otoczenie i chwilę. Następnie, za pomocą AI konwertującej tekst na obraz, kamera przekształca go w „zdjęcie”. Ale wynik nie jest tylko migawką. To skomplikowane i subtelne odzwierciedlenie miejsca, w którym się znajdujesz, i być może tego, jak model AI je „widzi”.

Paragraphica (źródło: bjoernkarmann.dk)

Kamera wykorzystująca inne AI

Podobnie jak nornica gwiazdkowata, która żyje i poluje pod ziemią, znajdując światło, urządzenie pozwala na „widzenie” świata poprzez inne perspektywy. Używając danych lokalizacyjnych i syntez obrazów AI, dostarcza głębszego wglądu w istotę chwili poprzez perspektywę innych inteligencji.

Tak jak w tradycyjnej kamerze, znajdują się tu trzy pokrętła. Pierwsze kontroluje promień (metry) obszaru, który kamera przeszukuje pod kątem miejsc i danych, podobnie jak długość ogniskowej w obiektywie. Drugie działa na zasadach zbliżonych do ziarna filmu, generując szum dla procesu dyfuzji obrazu AI. Trzecie pokrętło kontroluje skalę wskazówek. Zwiększanie ich sprawia, że sztuczna inteligencja śledzi akapit dokładniej.

paragraphica - trzy pokrętła (źródło: bjoernkarmann.dk)
Trzy pokrętła (źródło: bjoernkarmann.dk)

Paragraphica korzysta z technologii Raspberry Pi 4, 15-calowego ekranu dotykowego, obudowy wydrukowanej w 3D i niestandardowej elektroniki. Do stworzenia aplikacji webowej służącej do komunikacji między aparatem a wieloma API użyto platformy Noodl. Dzięki temu jest możliwe generowanie na podstawie lokalizacji zarówno tematu, jak i samego obrazu. Wielką wartością urządzenia jest to, że przekracza granice tradycyjnej fotografii, dając nam nie tylko obraz, ale i głębsze zrozumienie tego, co reprezentuje.