Apple, yakın zamanda tanıttığı Apple Intelligence özelliklerini geliştirirken NVIDIA’nın donanım hızlandırıcılarını kullanmadığını açıkladı. Bunun yerine, Apple Intelligence yapay zeka Temel Dil Modellerinin (AFM) eğitim verilerini işlemek için Google TPU’larına (Tensor İşleme Üniteleri) güvendi. İşte detaylar…
Apple, yapay zeka modelleri için NVIDIA’nın GPU’larını kullanmayacak, bunun yerine Google TPU’larına güveniyor
Apple’ın resmi araştırma makalesine göre, Google TPUv4 ve TPUv5 çiplerini kullanan sistemler, Apple Temel Modellerinin (AFM) oluşturulmasında önemli bir rol oynadı. AFM-server ve AFM-on-device modelleri, çevrimiçi ve çevrimdışı Apple Intelligence özelliklerini desteklemek için tasarlandı.
Yani Apple, AFM-server modelini 8,192 TPUv4 çipi kullanarak eğitti. Ön eğitim üç aşamada gerçekleştirildi: 6.3T token ile başlandı, ardından 1T token ile devam edildi ve son olarak 100B token ile bağlam uzatma yapıldı.
Apple, AFM’lerini eğitmek için Applebot web tarayıcısından toplanan veriler, çeşitli lisanslı “yüksek kaliteli” veri setleri, dikkatle seçilmiş kodlar, matematik ve kamuya açık veri setlerinden yararlandığını belirtti. AFM-on-device modeli ise 2,048 TPUv5p çip kullanılarak eğitildi ve AFM-server modelinden türetilmiş 3 milyar parametreli bir model.
Apple’ın kendi testlerine göre, AFM-server ve AFM-on-device, talimat izleme, araç kullanımı ve yazma gibi kıyaslamalarda mükemmel performans gösteriyor. Apple’ın bu detaylı araştırma makalesi,
Apple, yapay zeka oyununa geç katılmış olabilir, ancak bu adımlarla etkileyici bir performans sergilemeyi hedefliyor. Peki siz ne düşünüyorsunuz? Görüşlerinizi ve düşüncelerinizi aşağıdaki yorumlar kısmında paylaşmayı unutmayın.