İş Dünyası

Google DeepMind Yapay Zeka Soğutma Sistemi: Yapay Zeka Veri Merkezi Enerji Verimliliğinde Nasıl Devrim Yaratıyor?

Google DeepMind, 184.435 eğitim örneği (2 yıllık veri) üzerinde 5 katmanlı derin öğrenme, 50 düğüm, 19 girdi değişkeni ile PUE 1.1'de %0,4 hata ile %99,6 doğruluk ve -%40 veri merkezi soğutma enerjisi (ancak soğutma toplamın %10'u olduğundan sadece -%4 toplam tüketim) elde etmiştir. 3 tesiste onaylandı: Singapur (ilk dağıtım 2016), Eemshaven, Council Bluffs (5 milyar dolarlık yatırım). PUE Google filo genelinde 1,09, sektör ortalaması 1,56-1,58. Model Öngörülü Kontrol, BT yüklerini, hava durumunu ve ekipman durumunu eşzamanlı olarak yöneterek bir sonraki saatteki sıcaklık/basıncı tahmin eder. Garantili güvenlik: iki seviyeli doğrulama, operatörler yapay zekayı her zaman devre dışı bırakabilir. Kritik sınırlamalar: denetim firmalarından/ulusal laboratuvarlardan sıfır bağımsız doğrulama, her veri merkezi için özelleştirilmiş model gerekir (8 yıldır hiç ticarileştirilmedi). Uygulama 6-18 ay multidisipliner ekip gerektirir (veri bilimi, HVAC, tesis yönetimi). Veri merkezlerinin ötesinde uygulanabilir: endüstriyel tesisler, hastaneler, alışveriş merkezleri, kurumsal ofisler. 2024-2025: Google'ın TPU v5p için doğrudan sıvı soğutmaya geçmesi, yapay zeka optimizasyonunun pratik sınırlarını gösterir.

L'Zeka soğutulmasina uygulanan yapay zeka Veri merkezleri, endüstriyel enerji optimizasyonu alanındaki en önemli yeniliklerden birini temsil etmektedir.

Google DeepMind tarafından geliştirilen ve 2018'den bu yana faaliyette olan otonom sistem, yapay zekanın kritik altyapıların termal yönetimini nasıl dönüştürebileceğini göstererek operasyonel verimlilik açısından somut sonuçlar elde etti.

Veri Merkezlerini Dönüştüren İnovasyon

Enerji Verimliliği Sorunu

Enerji verimliliği konusunda küresel bir uzman olan Jonathan Koomey'e göre, modern veri merkezleri büyük enerji tüketicileridir ve soğutma, toplam elektrik tüketiminin yaklaşık yüzde 10'unu oluşturmaktadır. Google'ın bulut tabanlı yapay zeka sistemi her beş dakikada bir binlerce sensörden soğutma sisteminin anlık görüntüsünü alıyor Otonom veri merkezi soğutması ve endüstriyel kontrol için güvenlik öncelikli yapay zeka - Google DeepMind, geleneksel kontrol yöntemlerine meydan okuyan operasyonel karmaşıklığı analiz ediyor.

Google'ın yapay zekalı soğutma sistemi, farklı eylem kombinasyonlarının gelecekteki enerji tüketimi üzerindeki etkisini tahmin etmek için derin sinir ağları kullanıyor ve sağlam güvenlik kısıtlamalarını karşılarken hangi eylemlerin tüketimi en aza indireceğini belirliyor DeepMind AI, Google Veri Merkezi Soğutma Faturasını %40 Azaltıyor - Google DeepMind

Somut ve Ölçülebilir Sonuçlar

Soğutma optimizasyonunda elde edilen sonuçlar önemlidir: sistem soğutma için kullanılan enerjide sürekli olarak %40'lık bir azalma sağlayabilmiştir. Bununla birlikte, soğutmanın toplam tüketimin yaklaşık yüzde 10'unu oluşturduğu düşünüldüğünde, bu veri merkezinde yaklaşık yüzde 4'lük bir genel enerji tasarrufu anlamına gelmektedir.

Jim Gao'nun orijinal teknik makalesine göre, sinir ağı ortalama 0,004 mutlak hata ve 0,005 standart sapma elde ediyor, bu da 1,1 PUE için %0,4'lük bir hataya denk geliyor.

Çalıştığı Yer: Veri Merkezleri Onaylandı

Doğrulanmış Uygulamalar

Yapay zeka sisteminin uygulanması üç özel veri merkezinde resmi olarak onaylandı:

Singapur: Veri merkezinin soğutma için geri kazanılmış su kullandığı ve soğutma enerjisinde %40 azalma sağladığı 2016'daki ilk önemli dağıtım.

Eemshaven, Hollanda: Veri merkezi endüstriyel su kullanıyor ve 2023 yılında 232 milyon galon su tüketti. Tesisin saha sorumlusu Marco Ynema, bu gelişmiş tesisin operasyonlarını denetliyor.

Council Bluffs, Iowa: MIT Technology Review, yapay zeka sisteminin tartışılması sırasında Council Bluffs veri merkezini özellikle gösterdi. Google, 2023 yılında 980,1 milyon galon su tüketecek olan iki Council Bluffs kampüsüne 5 milyar dolar yatırım yapmıştır.

Bulut tabanlı bir yapay zeka kontrol sistemi artık çalışır durumda ve birden fazla Google veri merkezinde enerji tasarrufu sağlıyor, ancakşirket teknolojiyi kullanan tesislerin tam listesini yayınlamadı.

Teknik Mimari: Nasıl Çalışır?

Derin Sinir Ağları ve Makine Öğrenimi

US20180204116A1 patentine göre sistem, hassas teknik özelliklere sahip birderin öğrenme mimarisi kullanıyor:

  • Katman başına 50 düğümlü 5 gizli katman
  • 19 ısı yükleri, hava koşulları, ekipman durumu dahil normalize edilmiş girdi değişkenleri
  • 5 dakikalık çözünürlükte 184.435 eğitim örneği (yaklaşık 2 yıllık operasyonel veri)
  • Düzenlileştirme parametresi: Aşırı uyumu önlemek için 0,001

Mimari, derin sinir ağları ile entegre edilmiş doğrusal ARX modelleri ile Model Öngörülü Kontrol kullanır. Sinir ağları, kullanıcının modeldeki değişkenler arasındaki etkileşimleri önceden tanımlamasını gerektirmez. Bunun yerine, sinir ağı otomatik olarak optimum bir model oluşturmak için özellikler arasındaki kalıpları ve etkileşimleri arar.

Güç Kullanım Etkinliği (PUE): Anahtar Metrik

PUE, veri merkezlerinin temel enerji verimliliğini temsil eder:

PUE = Toplam Veri Merkezi Enerjisi / BT Ekipmanı Enerjisi

  • Google filo genelinde PUE: 2024'te 1,09 (Google çevre raporlarına göre)
  • Endüstriyel ortalama: 1,56-1,58
  • İdeal PUE: 1.0 (teorik olarak imkansız)

Google, katı operasyonel standartları garanti eden ancak AI sisteminin performansını özel olarak doğrulamayan enerji yönetimi için ISO 50001 sertifikasına sahiptir.

Model Öngörülü Kontrol (MPC)

İnovasyonun merkezinde, gelecekteki veri merkezi sıcaklığını ve basıncını bir sonraki saat içinde tahmin eden ve operasyonel kısıtlamaların aşılmamasını sağlamak için önerilen eylemleri simüle eden öngörücü kontrol yer alıyor.

Soğutmada Yapay Zekanın Operasyonel Faydaları

Üstün Tahminsel Doğruluk

Deneme ve yanılmalardan sonra, modeller PUE'yi tahmin etmede artık yüzde 99,6 oranında doğrudur. Bu doğruluk, mekanik, elektrik ve çevresel sistemler arasındaki karmaşık doğrusal olmayan etkileşimleri eşzamanlı olarak ele alarak geleneksel yöntemlerle imkansız optimizasyonları mümkün kılmaktadır.

Sürekli Öğrenme ve Adaptasyon

Önemli bir özellik de evrimsel öğrenme kabiliyetidir. Dokuz ay boyunca, sistemin performansı ilk açılışta %12 'lik bir iyileşmeden yaklaşık %30'luk bir iyileşmeye yükselmiştir.

Google operatörü Dan Fuenffinger şunları söyledi: 'Yapay zekanın kış koşullarından yararlanmayı ve normalden daha soğuk su üretmeyi öğrendiğini görmek inanılmazdı. Kurallar zaman içinde gelişmiyor ama yapay zeka gelişiyor'.

Çok Değişkenli Optimizasyon

Sistem 19 kritik operasyonel parametreyi aynı anda yönetir:

  • Sunucuların ve ağların toplam BT yükü
  • Hava koşulları (sıcaklık, nem, entalpi)
  • Ekipman durumu (soğutucular, soğutma kuleleri, pompalar)
  • Ayar noktaları ve operasyonel kontroller
  • Fan hızı ve VFD sistemleri

Güvenlik ve Kontrol: Arıza Güvenliği Garantili

Çok Düzeyli Doğrulama

Operasyonel güvenlik, yedek mekanizmalar aracılığıyla sağlanır. Yapay zeka tarafından hesaplanan optimum eylemler, operatör tarafından tanımlanan güvenlik kısıtlamalarının dahili bir listesine karşı kontrol edilir. Fiziksel veri merkezine gönderildikten sonra, yerel kontrol sistemi talimatları yeniden kontrol eder DeepMind AI, Google veri merkezlerini soğutmak için kullanılan enerjiyi yüzde 40 oranında azaltır.

Operatörler kontrolü her zaman ellerinde tutarlar ve istedikleri zaman AI modundan çıkarak geleneksel kurallara sorunsuz bir şekilde geçiş yapabilirler.

Sınırlamalar ve Metodolojik Hususlar

PUE Metrikleri ve Sınırlamaları

Sektör, bir metrik olarak Güç Kullanım Etkinliğinin sınırlarını kabul etmektedir. 2014 yılında Uptime Institute tarafından yapılan bir ankete katılanların yüzde 75'i sektörün yeni bir verimlilik ölçütüne ihtiyacı olduğuna inanmaktadır. Sorunlar arasında iklim yanlılığı (farklı iklimleri karşılaştırmak imkansız), zaman manipülasyonu (optimum koşullar sırasında ölçümler) ve bileşenlerin hariç tutulması yer almaktadır.

Uygulama Karmaşıklığı

Her veri merkezinin kendine özgü bir mimarisi ve ortamı vardır. Bir sistem için özelleştirilmiş bir model diğerine uygulanamayabilir ve genel bir istihbarat çerçevesi gerektirir.

Veri Kalitesi ve Doğrulama

Modelin doğruluğu, girdi verilerinin kalitesine ve miktarına bağlıdır. Model hatası, ilgili eğitim verilerinin azlığı nedeniyle genellikle 1,14'ün üzerindeki PUE değerleri için artar.

Büyük denetim firmaları ya da ulusal laboratuvarlar tarafından yapılan bağımsız denetimlere rastlanmamış, Google asgari federal gerekliliklerin ötesinde 'üçüncü taraf denetimlerini takip etmemiştir'.

Gelecek: Sıvı Soğutmaya Doğru Evrim

Teknolojik Geçiş

Google, 2024-2025 yıllarında vurguyu dramatik bir şekilde bu yöne kaydırdı:

  • 1MW raflar için +/-400 VDC güç kaynağı sistemleri
  • "Project Deschutes" soğutma dağıtım üniteleri
  • TPU v5p için '%99,999 çalışma süresi' ile doğrudan sıvı soğutma.

Bu değişiklik, YZ optimizasyonunun modern YZ uygulamalarının termal yükleri için pratik sınırlara ulaştığını göstermektedir.

Gelişen Trendler

  • Uç bilişim entegrasyonu: daha düşük gecikme süresi için dağıtılmış yapay zeka
  • Dijital ikizler: Gelişmiş simülasyon için dijital ikizler
  • Sürdürülebilirlik odağı: Yenilenebilir enerji için optimizasyon
  • Hibrit soğutma: AI için optimize edilmiş sıvı/hava kombinasyonu

Şirketler için Uygulamalar ve Fırsatlar

Uygulama Sektörleri

Soğutma için yapay zeka optimizasyonu, veri merkezlerinin ötesinde uygulamalara sahiptir:

  • Endüstriyel tesisler: Üretim HVAC sistemlerinin optimizasyonu
  • Alışveriş merkezleri: Akıllı iklim yönetimi
  • Hastaneler: Ameliyathanelerin ve kritik alanların çevresel kontrolü
  • Kurumsal ofisler: Akıllı bina ve tesis yönetimi

Yatırım Getirisi ve Ekonomik Faydalar

Soğutma sistemlerinde enerji tasarrufu sağlar:

  • Soğutma alt sistemi işletme maliyetlerinin azaltılması
  • Çevresel sürdürülebilirliğin iyileştirilmesi
  • Ekipman ömrünün uzatılması
  • Artan operasyonel güvenilirlik

Şirketler için Stratejik Uygulama

Benimseme Yol Haritası

Aşama 1 - Değerlendirme: Enerji denetimi ve mevcut sistemlerin haritalanması Aşama2 - Pilot: Sınırlı bir bölümde kontrollü bir ortamda test Aşama3 - Dağıtım: Yoğun izleme ile aşamalı dağıtım Aşama4 - Optimizasyon: Sürekli ayarlama ve kapasite genişletme

Teknik Hususlar

  • Sensör altyapısı: Komple izleme ağı
  • Ekip becerileri: veri bilimi, tesis yönetimi, siber güvenlik
  • Entegrasyon: Eski sistemlerle uyumluluk
  • Uyumluluk: güvenlik ve çevre düzenlemeleri

SSS - Sıkça Sorulan Sorular

1. Yapay zeka sistemi hangi Google veri merkezlerinde gerçekten çalışıyor?

Üç veri merkezi resmi olarak onaylanmıştır: Singapur (ilk dağıtım 2016), Hollanda'da Eemshaven ve Iowa'da Council Bluffs. Sistem birden fazla Google veri merkezinde çalışır durumda ancak tam liste hiçbir zaman kamuya açıklanmadı.

2. Toplam tüketimde gerçekten ne kadar enerji tasarrufu sağlıyor?

Sistem soğutma için kullanılan enerjide %40'lık bir azalma sağlamaktadır. Soğutmanın toplam tüketimin yaklaşık yüzde 10'unu oluşturduğu düşünüldüğünde, toplam enerji tasarrufu toplam veri merkezi tüketiminin yaklaşık yüzde 4'üne denk gelmektedir.

3. Sistemin tahmin doğruluğu ne kadar doğru?

Sistem, 1,1‍ PUE için %0,4'lük bir hataya eşdeğer olan 0,004 ± 0,005'lik ortalama mutlak hata ile PUE tahmininde %99,6'lık bir doğruluk elde eder. Gerçek PUE 1,1 ise, YZ 1,096 ile 1,104 arasında bir tahminde bulunur.

4. Operasyonel güvenliği nasıl sağlıyorsunuz?

İki seviyeli doğrulama kullanır: önce yapay zeka operatörler tarafından tanımlanan güvenlik kısıtlamalarını kontrol eder, ardından yerel sistem talimatları tekrar kontrol eder. Operatörler her zaman YZ kontrolünü devre dışı bırakabilir ve geleneksel sistemlere geri dönebilir.

5. Böyle bir sistemi uygulamak ne kadar sürer?

Uygulama genellikle 6-18 ay sürer: veri toplama ve model eğitimi için 3-6 ay, pilot test için 2-4 ay, aşamalı dağıtım için 3-8 ay. Karmaşıklık, mevcut altyapıya bağlı olarak önemli ölçüde değişir.

6. Hangi teknik becerilere ihtiyaç var?

Veri bilimi/AI, HVAC mühendisliği, tesis yönetimi, siber güvenlik ve sistem entegrasyonu konularında uzmanlığa sahip multidisipliner bir ekibe ihtiyaç vardır. Birçok şirket uzman tedarikçilerle ortaklık kurmayı tercih ediyor.

7. Sistem mevsimsel değişikliklere uyum sağlayabiliyor mu?

Evet, yapay zeka, soğutma enerjisini azaltmak için kışın daha soğuk su üretmek gibi mevsimsel koşullardan yararlanmayı otomatik olarak öğrenir. Sistem, hava ve iklim modellerini tanıyarak sürekli olarak gelişir.

8. Google neden bu teknolojiyi ticarileştirmiyor?

Her veri merkezinin kendine özgü bir mimarisi ve ortamı vardır ve önemli ölçüde özelleştirme gerektirir. Uygulamanın karmaşıklığı, özel veri ihtiyacı ve gerekli uzmanlık doğrudan pazarlamayı karmaşık hale getiriyor. Sekiz yılın ardından, bu teknoloji yalnızca Google'ın bünyesinde kalmaya devam ediyor.

9. Bağımsız performans değerlendirmeleri var mı?

Büyük denetim firmaları (Deloitte, PwC, KPMG) veya ulusal laboratuvarlar tarafından yapılan bağımsız denetimlere rastlanmamıştır. Google ISO 50001 sertifikasına sahiptir ancak asgari federal gerekliliklerin ötesinde 'üçüncü taraf denetimlerini takip etmemektedir'.

10. Veri merkezlerinin yanı sıra diğer sektörlere de uygulanabilir mi?

Kesinlikle. Soğutma için yapay zeka optimizasyonu endüstriyel tesislere, alışveriş merkezlerine, hastanelere, kurumsal ofislere ve karmaşık HVAC sistemlerine sahip herhangi bir tesise uygulanabilir. Çok değişkenli optimizasyon ve öngörücü kontrol ilkeleri evrensel olarak uygulanabilir.

Google DeepMind AI soğutma sistemi, belirli bir alanda aşamalı iyileştirmeler sağlayan bir mühendislik yeniliğini temsil etmektedir. Bu teknoloji, enerji yoğun altyapılar işleten şirketler için, ölçeğin vurgulanan sınırlamaları olsa da, soğutma optimizasyonu için somut fırsatlar sunmaktadır.

Ana kaynaklar: Jim Gao Google Araştırma makalesi, DeepMind Resmi Blogu, MIT Technology Review, Patent US20180204116A1

İşletmelerin büyümesi için kaynaklar