Melisa Çevik

Bu projede, kullanıcıların sesli komutlarla görseller oluşturmasını sağlayan bir uygulama geliştirilmiştir. Uygulama, ses kaydını alıp metne çevirir ve ardından yapay zeka modelleriyle görsel üretir.

VoiceDraw: Sesli Komutlarla Görsel Oluşturma

VoiceDraw, kullanıcıların sesli komutlarla görseller oluşturmasını sağlayan bir uygulamadır. Uygulama, ses kaydını alıp metne çevirir ve ardından yapay zeka modelleriyle görsel üretir.

Ekran Resmi 2025-02-21 16 01 31

📌 Özellikler

Ses Kaydı: Kullanıcıdan sesli giriş alır.
Metne Dönüştürme: OpenAI Whisper API ile sesi metne çevirir.
Görsel Üretimi:
- OpenAI DALL-E 3 kullanarak metinden görsel üretir.
- Google Gemini Vision Pro kullanarak görsel bazlı düzenlemeler yapar.
Streamlit Arayüzü: Kullanıcı dostu bir arayüz sunar.
Görsel İndirme: Üretilen görselleri indirilebilir hale getirir.

🚀 Proje Adımları

Ses Kaydı:
- Kullanıcıdan sesli giriş alır.
- Ses kaydını almak için gerekli kodlar yazılır.
Metne Dönüştürme:
- OpenAI Whisper API ile sesi metne çevirir.
Görsel Üretimi:
- OpenAI DALL-E 3 kullanarak metinden görsel üretir.
- Google Gemini Vision Pro kullanarak görsel bazlı düzenlemeler yapar.
Streamlit Arayüzü:
- Kullanıcı dostu bir arayüz sunar.
Görsel İndirme:
- Üretilen görselleri indirilebilir hale getirir.

🛠️ Teknolojiler

Python: Programlama dilidir.
Streamlit: Kullanıcı arayüzü oluşturmak için kullanılır.
OpenAI: Yapay zeka modelleri için API'ler sunar.
Google Gemini Vision Pro: Görsel işleme için kullanılır.

VoiceDraw: Sesli Komutlarla Görsel Oluşturma

📌 Özellikler

🚀 Proje Adımları

🛠️ Teknolojiler

📚 Referanslar