Ekonomi

Alibaba, gelişmiş metin işleme özellikli 20B görüntü modeli Qwen-Image’ı tanıttı

Investing.com — Alibaba, karmaşık metin işleme ve hassas görüntü düzenleme yeteneklerinde önemli ilerlemeler sağlayan 20B MMDiT görüntü temel modelini Qwen-Image’ı piyasaya sürdü.

Kullanıcıların Qwen Chat üzerinden “Görüntü Oluşturma” seçeneğini seçerek erişebilecekleri yeni model, çok satırlı düzenleri, paragraf düzeyindeki anlamları ve ince ayrıntıları işleyebilen üstün metin işleme yeteneklerine sahip. Model, İngilizce gibi alfabetik dilleri ve Çince gibi logografik dilleri yüksek doğrulukla destekliyor.

Bununla birlikte, Qwen-Image geliştirilmiş çoklu görev eğitim paradigması sayesinde tutarlı görüntü düzenleme sunuyor. Düzenleme işlemleri sırasında hem anlamsal içeriği hem de görsel gerçekçiliği korumada olağanüstü performans gösteriyor.

Alibaba’ya göre, model hem üretim hem de düzenleme görevlerinde GenEval, DPG, OneIG-Bench, GEdit, ImgEdit ve GSO dahil olmak üzere birçok kamu kıyaslama testinde mevcut çözümlerden daha iyi performans gösteriyor. Özellikle LongText-Bench, ChineseWord ve TextCraft gibi metin işleme kıyaslama testlerinde, mevcut en gelişmiş modellerden önemli ölçüde daha iyi sonuçlar elde ediyor.

Şirket, Qwen-Image’ın yeteneklerini çeşitli örneklerle gösterdi. Bunlar arasında dükkan tabelalarında uygun alan derinliğiyle Çince karakterleri doğru şekilde oluşturma, kitap kapaklarında ve bilgi slaytlarında ayrıntılı İngilizce metinler yaratma ve çift dilli içeriği kolaylıkla işleme yer alıyor.

Bu arada, Qwen-Image metin işlemenin ötesinde, gerçekçi sahnelerden empresyonist resimlere kadar geniş bir sanatsal stil yelpazesini destekliyor. Ayrıca stil aktarımı, ekleme, silme, ayrıntı geliştirme, metin düzenleme ve karakter duruş ayarlaması gibi çeşitli düzenleme işlemlerini sunuyor.

Alibaba, Qwen-Image’ın görüntü oluşturmayı geliştirmeyi, görsel içerik oluşturmadaki teknik engelleri azaltmayı ve yenilikçi uygulamaları teşvik etmeyi amaçladığını belirtti. Şirket, “açık, şeffaf ve sürdürülebilir bir üretken yapay zeka ekosistemi” oluşturmak için topluluk katılımını ve geri bildirimini bekliyor.

Modelin Ağustos 2025’te piyasaya sürülmesi planlanıyor.

Bu makale yapay zekanın desteğiyle oluşturulmuş, çevrilmiş ve bir editör tarafından incelenmiştir. Daha fazla bilgi için Şart ve Koşullar bölümümüze bakın.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu