Purpose: This review aims to delve into the question of whether artificial intelligence (AI) could be used to create images that are linguistically and culturally relevant for individuals with acquired language disorders with specific consideration of Turkish. Images are one of highly preferred stimuli among acquired language disorders both in research and clinical contexts.
Method: A narrative review methodology was adopted in the study by synthesizing the findings from previous studies. A literature review was carried out using various databases including Web of Science, Scopus, and EBSCO with search terms including “acquired language disorders”, “aphasia”, “image research”, “artificial intelligence”, “text-to-image generation”, and “prompt engineering”.
Results: Previous studies on image research including neurotypical adults and individuals with aphasia were introduced to draw a comprehensive picture of what ideal image characteristics would involve. The potential uses of AI in acquired language disorders were discussed with particular focus on image generation tools by unraveling the options of image generation, practice of writing prompts, potential benefits and challenges of text-to-image generation tools, and the need to consider cultural and linguistic diversity in the formation of images.
Conclusion: There is a lack of research that embodies AI and image research together, which means that there needs to be a close collaboration between the researchers in the field of AI and those in the aphasia rehabilitation. Regarding languages other than English, AI-generated image tools need to consider the unique linguistic and cultural characteristics of the languages concerned. It is suggested that the use of these tools should be promoted among speech and language therapists in their clinical practice, and their experiences with these tools should be documented so that image generation could be a part of clinical practice.
image research artificial intelligence Turkish Text-to-image generation human-computer interaction acquired language disorders aphasia rehabilitation
Amaç: Görseller edinilmiş dil bozukluklarında araştırma ve klinik uygulamalarda en çok tercih edilen uyaranlardan biridir. Dil ve konuşma terapistleri (DKT) afazili bireyler için görsel oluşturma, bulma veya seçme sürecinde zorlanabilir. Görsellerin anlamlı ve net olması beklenebilir. Bu sebepten, seçilen görselin karşılık geldiği sözcük, ileti ve kavramları net bir şekilde temsil etmesi gerekmektedir (Brown & Thiessen, 2018; Pierce, 2024). Afazili bireylerin dil becerileri heterojen olabilir ve dil modalitelerine ait performans modaliteye özgü değişkenlik gösterebilir (örn. İşitsel ve yazılı anlama, tekrarlama, adlandırma, okuma, yazma). Bununla birlikte metinden görsel oluşturma araçlarını içeren Yapay Zekâ (YZ) teknolojisindeki son gelişmeler, afazili bireyler için uygun görsel belirleme sürecinde DKT’lere farklı bir seçenek sunabilir. YZ teknolojisi halen gelişmeye devam etmektedir ve YZ destekli görsel oluşturma süreçlerinin görsel araştırmalarına nasıl katkıda bulunacağı merak konusudur. Dolayısıyla, bu derleme YZ’nin edinilmiş dil bozukluğu olan bireyler için dilsel ve kültürel açıdan uygun görseller oluşturmada kullanılıp kullanılamayacağı sorusunu Türkçe özelinde ele almayı amaçlamaktadır.
Yöntem: Bu çalışma geleneksel derleme metodolojisini benimsemiştir. Web of Science, Scopus ve EBSCO veri tabanlarında “edinilmiş dil bozuklukları”, “afazi”, “görsel araştırmaları”, “yapay zekâ”, “metinden görsel oluşturma”, ve “prompt mühendisliği” arama terimleri kullanılarak Haziran-Ağustos 2024 aralığında alan yazın taraması gerçekleştirilmiştir. Tarama sırasında son 10 yılda yayımlanan çalışmalar (2014-2024) öncelikli olarak incelenmiştir, ancak konunun edinilmiş dil bozukluklarındaki önemini vurgulamak ve kuramsal temellerini ortaya koymak amacıyla 2014 öncesinde yayımlanan bazı kaynaklar da dahil edilmiştir.
Bulgular: Bu amaç doğrultusunda derleme iki bölüme ayrılmıştır: İlk olarak, ideal bir görselde bulunması gereken özelliklerin neler olduğuna dair bilgi vermek üzere sağlıklı ve afazili bireyleri dahil eden görsel araştırmalarından bahsedilmiştir. Devamında, görsel oluşturma araçlarına odaklanarak YZ’nin edinilmiş dil bozukluklarında olası kullanımları hakkında bilgi verilmiştir. Görsel araştırmalarının bulguları incelendiğinde; görselin doğru şekilde tanınması, görselin türü ve bağlamı, görsellerin somut veya soyut olması ile kültürel faktörlerin dikkate alınması gerektiği belirtilmektedir. Görseller arasında özellikle el çizimlerinin araştırma ve klinik bağlamlarda uzun süreden beri kullanıldığı bilinmektedir. Bununla birlikte fotoğrafların popülerlik kazandığı; erişilebilirliği ve düşük maliyeti sebebiyle de bu popülerliğin arttığı bilinmektedir. Son yıllarda YZ’nin gelişmesi ile birlikte, metin üzerinden görsel oluşturma teknolojisinin DKT’ler için önemli bir seçenek olabileceği düşünülmektedir. Bu teknolojinin adlandırma da dahil olmak üzere farklı amaçlarla kullanılabileceği belirtilmektedir. Bu zamana kadar YZ tarafından oluşturulan görsellerin adlandırma veya ilişkili bir dil becerisi bağlamında incelenmediği gözlenmekle birlikte, sadece Pierce (2024) DALL-E 2 tarafından oluşturulan görsellerin işlevselliğini değerlendirdiği bir çalışma gerçekleştirmiştir. Çalışmanın bulguları, isimlere ait görsellerin eylem ve cümlelere kıyasla daha net olduğunu göstermiştir (Pierce, 2024). Derlemenin ikinci bölümünde, edinilmiş dil bozuklukları alanında görsel uyaran kullanan araştırmacı ve DKT’lere yol gösterebilecek birtakım bilgiler sunulmuştur. Öncelikle görsel üretim seçeneklerinden bahsedilmiştir (örn. DALL-E 3 , Midjourney , Stable Diffusion , Glide , Craiyon , gibi). Devamında “kısa ve betimleyici / açıklayıcı metin” olarak tanımlanan prompt hakkında bilgi verilmiş (Lo, 2023), prompt yazımı için ileri düzey bir teknik veya programlama becerisine ihtiyaç duyulmadığı vurgulanmıştır (Adikari ve ark., 2024). Buna rağmen promptun içeriğine ve sonrasında ortaya çıkan sonuca (veya ürüne) dikkat çekilmiş, prompt üzerinde yapılabilecek düzenlemeler ile prompt taksonomisinin içeriğinden bahsedilmiştir (Oppenlaender 2022; 2024). Son olarak, metinden görsel oluşturma araçlarının olası faydaları ile zorlukları ve görsellerin oluşturulmasında kültürel ve dilsel çeşitliliği göz önünde bulundurma ihtiyacı dile getirilmiştir.
Sonuç: YZ ve görsel araştırmalarını bir araya getiren araştırmaların sayısının oldukça az olduğu gözlenmiştir. Bu durum YZ ile afazi rehabilitasyonunda çalışan araştırmacılar arasında yakın bir iş birliği olması gerektiğini göstermektedir. Ayrıca, İngilizce dışında farklı bir dilde prompt yazılmasına olanak veren görsel üretim araçlarının ilgili dillerin kendine özgü dilsel ve kültürel özelliklerini dikkate alması gerekmektedir. Bu araçların dil ve konuşma terapistlerinin klinik uygulamalarında kullanımının teşvik edilmesi ve görsel üretiminin klinik uygulamanın bir parçası olabilmesi için bu araçlarla ilgili dil ve konuşma terapistlerinin deneyimlerinin incelenmesi önerilmektedir.
yapay zeka Türkçe Metinden görsel oluşturma insan-bilgisayar etkileşimi görsel araştırmaları edinilmiş dil bozuklukları afazi rehabilitasyonu
Birincil Dil | İngilizce |
---|---|
Konular | Konuşma Patolojisi |
Bölüm | Derleme |
Yazarlar | |
Yayımlanma Tarihi | 30 Nisan 2025 |
Gönderilme Tarihi | 5 Aralık 2024 |
Kabul Tarihi | 3 Mart 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 1 |
DKYAD Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.