سیستم AlphaGo Zero یادگیری را از صفر شروع میکند، یعنی بدون هر گونه نظارتی خودش به خودش آموزش میدهد و از روش یادگیری تقویت شده پیروی میکند.
باید دانست که این روش یادگیری قدرت بالاتری دارد، زیرا محدود به قدرت فکر بشر نیست و میتواند مرزهای بالاتری از دانش را درنوردد.
این سیستم سعی میکند بدون هر گونه راهنمایی انسانی بازی گو را یاد بگیرد. تنها پس از سه روز یادگیری، این سیستم توانست سیستمهای قبلی آلفاگو را شکست بدهد.