Jest coś magicznego w momencie, kiedy wciskasz spust migawki aparatu. W jednej chwili zapisujesz kawałek rzeczywistości, który stanie się częścią twojego życia na zawsze. A może moglibyśmy zrobić to na zupełnie nowy sposób? Z pomocą Paragraphica, kamery wykorzystującej sztuczną inteligencję do przekształcania tekstu w obraz, zaczynamy doświadczać świata na zupełnie innym poziomie.
Jak Działa Paragraphica?
Ten innowacyjny gadżet działa zarówno jako fizyczny prototyp, jak i wirtualna kamera, którą możesz wypróbować. Wizjer aparatu wyświetla opis Twojej aktualnej lokalizacji w czasie rzeczywistym, a po naciśnięciu spustu migawki kamera tworzy scyntygraficzne przedstawienie tego opisu. Aparat działa, zbierając dane z lokalizacji za pomocą otwartych API, wykorzystując adres, pogodę, porę dnia i pobliskie miejsca.
Analizując te punkty danych, Paragraphica komponuje akapit, który szczegółowo przedstawia aktualne otoczenie i chwilę. Następnie, za pomocą AI konwertującej tekst na obraz, kamera przekształca go w „zdjęcie”. Ale wynik nie jest tylko migawką. To skomplikowane i subtelne odzwierciedlenie miejsca, w którym się znajdujesz, i być może tego, jak model AI je „widzi”.
Kamera wykorzystująca inne AI
Podobnie jak nornica gwiazdkowata, która żyje i poluje pod ziemią, znajdując światło, urządzenie pozwala na „widzenie” świata poprzez inne perspektywy. Używając danych lokalizacyjnych i syntez obrazów AI, dostarcza głębszego wglądu w istotę chwili poprzez perspektywę innych inteligencji.
Tak jak w tradycyjnej kamerze, znajdują się tu trzy pokrętła. Pierwsze kontroluje promień (metry) obszaru, który kamera przeszukuje pod kątem miejsc i danych, podobnie jak długość ogniskowej w obiektywie. Drugie działa na zasadach zbliżonych do ziarna filmu, generując szum dla procesu dyfuzji obrazu AI. Trzecie pokrętło kontroluje skalę wskazówek. Zwiększanie ich sprawia, że sztuczna inteligencja śledzi akapit dokładniej.
![Paragraphica, czyli jak sztuczna inteligencja "na ślepo" fotografuje świat paragraphica - trzy pokrętła (źródło: bjoernkarmann.dk)](https://oiot.pl/wp-content/uploads/2023/06/paragraphica-1-1600x896.png)
Paragraphica korzysta z technologii Raspberry Pi 4, 15-calowego ekranu dotykowego, obudowy wydrukowanej w 3D i niestandardowej elektroniki. Do stworzenia aplikacji webowej służącej do komunikacji między aparatem a wieloma API użyto platformy Noodl. Dzięki temu jest możliwe generowanie na podstawie lokalizacji zarówno tematu, jak i samego obrazu. Wielką wartością urządzenia jest to, że przekracza granice tradycyjnej fotografii, dając nam nie tylko obraz, ale i głębsze zrozumienie tego, co reprezentuje.