And now of something completely different

Читаем

http://www.dtf.ru/news/read.php?id=47801

и оригинал

http://www.escapistmagazine.com/news/view/76574-PS3-hits-top-form-in-four-to-six-years-Sony-says

Заголовки жгут – что оригинал, что перевод. Интересно, а что значит performing optimally, и чем это черевато? Впрочем это риторический вопрос.

Те кто начинает играться с PS2 PA с удивлением узнают, что 30% EE утилизации – это хороший результат. Обычно всё значительно хуже. Многие нагружали VU1 близко к 70-90%, у некоторых даже было видно зелёный график VU0 – процентов скажем 15%.

Для сравнения можно попробовать посчитать утилизацию на новомодном Core 2 Duo, скажем на синтетике – или попробовать её найти в Google. А затем долго удивляться; по крайней мере понятно почему пришлось так долго искать. Хинт: 1 SSE instruction per clock per core, т-е например 2 GHZ 2 ядра должен выдавать 8 GFLOP, или 16 single precision GFLOP. На практике 10 single precision GFLOP уже подвиг, а типичная картина это 2-4, т-е типично меньше 30%, и порядка 70% в пике.

Ну а теперь собственно по теме – теоретическая производительность у SPU – 25.6 single precision GFLOP (никак не 32, и опять-же mad в одну инструкцию за 2 операции, но 2 инструкции за такт). Т-е типичные 30% это будет 7-8 GFLOP, а пиковые 70-90% будет 16-20 GFLOP. Их там для девеолпера почти 6 штук. Т.е 40 GFLOP можно влобно сейчас, а через те самые 5-6 лет мы увидим 120 GFLOP в живых приложениях ==> масса места для подвигов, немерянно наград на пути.

Т-е бедолага хотел сказать, что «выше только небо» – уже сейчас влбоно в 10 раз быстрее, а поучуствовать потолок получится только через несколько лет. А вместо этого сказал что «игры попрут через 5-6 лет». Тоска, вечнозелёная.

P.S. Не хочу, чтобы меня поняли правильно – а что будет с системой охлаждения при 100% утилизации? Пусть уже Шодан расскажет как горели AIT-шные видеокарты; мой мега-лаптоп c NV6800 ultra впадал в throttle, и начинал казать 3-7 fps. Не пишите оптимальный код!

  • CEMEH

    Да, вас тоже не любят…

  • IronPeter

    Вроде как у Core2 двухпортовый полноскоростной SSE. То есть madd за такт.

  • look4awhile

    т-е я вдвое обшибся?

  • IronPeter

    Вроде да, ошибся. Но оно все одно – вспомнишь про spu_shuffle – и веселее становится. Другие это флопы, с человеческим лицом.

  • look4awhile

    а где в SSE есть mad?

  • IronPeter

    в SSE нет mad. В Core2 есть два FPU порта – про умножение и сложение.

  • look4awhile

    я про SSE инструкции. иначе не набирается флопов-то
    видимо чего-то недопонял. объяснишь понятно?

  • IronPeter

    За такт могут вроде стартовать две арифметические SSE инструкции – сложение и умножение, на двух портах. Если код в кеше, если декодировщик выплюнул, если оно во всяких там очередях переупорядочения отлежалось, много разных если.

    Так оно было давно, только в старом железе 128 битная операция делилась на половинки. За один такт стартовала одна, потом другая. Т.е. внутри SSE был таким 3dNOW!. А сейчас полноскоростное выполнение.

    Могу ощибаться, я давно не интересовался.