VoiceDraw: Sesli Komutlarla Görsel Oluşturma
PythonStreamlitOpenAIStabilityAIAssemblyAI
Bu projede, kullanıcıların sesli komutlarla görseller oluşturmasını sağlayan bir uygulama geliştirilmiştir. Uygulama, ses kaydını alıp metne çevirir ve ardından yapay zeka modelleriyle görsel üretir.
VoiceDraw: Sesli Komutlarla Görsel Oluşturma
VoiceDraw, kullanıcıların sesli komutlarla görseller oluşturmasını sağlayan bir uygulamadır. Uygulama, ses kaydını alıp metne çevirir ve ardından yapay zeka modelleriyle görsel üretir.
📌 Özellikler
- Ses Kaydı: Kullanıcıdan sesli giriş alır.
- Metne Dönüştürme: OpenAI Whisper API ile sesi metne çevirir.
- Görsel Üretimi:
- OpenAI DALL-E 3 kullanarak metinden görsel üretir.
- Google Gemini Vision Pro kullanarak görsel bazlı düzenlemeler yapar.
- Streamlit Arayüzü: Kullanıcı dostu bir arayüz sunar.
- Görsel İndirme: Üretilen görselleri indirilebilir hale getirir.
🚀 Proje Adımları
-
Ses Kaydı:
- Kullanıcıdan sesli giriş alır.
- Ses kaydını almak için gerekli kodlar yazılır.
-
Metne Dönüştürme:
- OpenAI Whisper API ile sesi metne çevirir.
-
Görsel Üretimi:
- OpenAI DALL-E 3 kullanarak metinden görsel üretir.
- Google Gemini Vision Pro kullanarak görsel bazlı düzenlemeler yapar.
-
Streamlit Arayüzü:
- Kullanıcı dostu bir arayüz sunar.
-
Görsel İndirme:
- Üretilen görselleri indirilebilir hale getirir.
🛠️ Teknolojiler
- Python: Programlama dilidir.
- Streamlit: Kullanıcı arayüzü oluşturmak için kullanılır.
- OpenAI: Yapay zeka modelleri için API'ler sunar.
- Google Gemini Vision Pro: Görsel işleme için kullanılır.