Электроника, электротехника и приборы

Тестирование процессоров «Эльбрус-4С» и «Эльбрус-8С»

Опубликованы результаты сравнительного тестирования отечественных процессоров двух поколений — «Эльбрус-4С» (2014 год) и «Эльбрус-8С"(2016 год) в работе приложений по распознаванию паспортов и распознаванию автомобилей.

Специалисты Smart Engines сравнивали 4-ядерный и 8-ядерный 64-битные российские процессоры между собой в работе со своими приложениями, запущенными под операционной системой (ОС) «Эльбрус».

4-ядерный «Эльбрус-4С», которому уже больше 3 лет, работает на тактовой частоте 800 МГц. Проекты на его основе уже неоднократно обсуждались в российской техносфере разного рода специалистами и любителями. Приведенные авторами теста общие характеристики «железа» предыдущего поколения соответствуют ранее опубликованным: 23 операции на ядро за такт, L1 кэш (на ядро) 64 Кб, L2 кэш (на ядро) 2 Мб, поддержка до 3 каналов DDR3-1600, технологический процесс 65 нм, поддержка многопроцессорных систем — до 4 процессоров.

У русского 8-ядерника «Эльбрус-8С», который впервые всем стали демонстрировать в 2016 году, характеристики поинтереснее. Это и частота 1300 МГц, и 25 операций за такт на ядро. Появился L3 кэш 16 Мб. Поддержка до 4 каналов DDR3-1600. Техпроцесс — 28 нм.

Как пишут авторы, они ожидали качественного роста характеристик, и им удалось в этом убедиться. В зависимости от вида задачи новый российский процессор, показал увеличение производительности от 1,7 до 3,2 раза.

Результаты для распознавания паспорта получились довольно скромные, поскольку наше приложение в своем текущем виде не может эффективно задействовать более 4 потоков. Похожая ситуация с детекцией автомобилей и визуальной локацией: алгоритмы имеют нераспараллеленные участки, поэтому не приходится ожидать линейного масштабирования при росте числа ядер. Однако там, где нет ограничений на загрузку приложениями всех ядер процессора, мы наблюдаем рост в 3.2 раза, это близко к теоретическому пределу в 3.6 раз. В среднем разница производительности между поколениями процессоров МЦСТ на нашем наборе задач составляет порядка 2-3 раз, и это очень радует. Только за счёт увеличения частоты и совершенствования архитектуры мы наблюдаем выигрыш более чем в 1.7 раза.
В процессе тестов под полной нагрузкой мы не испытывали проблем с зависаниями и падениями, что говорит о зрелости процессорной архитектуры. Подход VLIW, развиваемый в Эльбрусах-8С, позволяет добиваться работы в реальном времени различных алгоритмов компьютерного зрения, а библиотека EML содержит весьма солидный набор математических функций, которые позволяют экономить время тем, кто не собирается оптимизировать код сам.

Детекция автомобилей на Эльбрус-8С:

Детекция объектов заданного типа — одна из классических задач технического зрения. Это может быть детекция лиц, людей, оставленных предметов или любого другого типа объектов, обладающих явными отличительными признаками.

Для примера взята задача детекции автомобилей, движущихся в попутном направлении. Подобный детектор может использоваться в системах автоматического управления транспортными средствами, в системах распознавания автомобильных номеров и т. д.

Визуальная локализация на Эльбрус-8С:

В этом приложении демонстрируется визуальная локализация на основе особых точек. Использовав панорамы Google Street View с GPS-привязкой, мы научили нашу систему узнавать местонахождение камеры без использования данных о её GPS-координатах или другой внешней информации. Такая система может использоваться для беспилотников и роботов в качестве резервной системы навигации, для уточнения текущего местоположения или для работы в системах без GPS.

Полная статья — Сравнение Эльбрус-4С и Эльбрус-8С в нескольких задачах машинного зрения

Хочешь всегда знать и никогда не пропускать лучшие новости о развитии России? У проекта «Сделано у нас» есть Телеграм-канал @sdelanounas_ru. Подпишись, и у тебя всегда будет повод для гордости за Россию.

Источник: https://habrahabr.ru/company/smarte...9858/-elbrus-4s-i-elbrus-8s-v-nesk/

Вступай в наши группы и добавляй нас в друзья :)

Поделись позитивом в своих соцсетях

Другие публикации по теме

Процессор, CPU, Эльбрус, 4C, 8C, тест, МЦСТ

16
shigorin
01.06.1713:15:56

(собирая firefox под e2k) Ох, а я-то как хочу 8С… но их пока совсем мало.
PS: добавьте тег МЦСТ, пожалуйста
PPS: спасибо!

Отредактировано: shigorin~18:33 01.06.17

#917661 ↑
5
Виктор Гюго
01.06.1714:20:25

неплохо, неплохо

#917699 ↑
Комментарий скрыт по причине низкого рейтинга. показать

-16
Mark Li
01.06.1719:21:20

Было бы не плохо в году 1999-2003. 28 нм, что ж ты такая жирная?!

Отредактировано: Mark Li~19:21 01.06.17

#917798 ↑

14
~~lowly cook~~
01.06.1722:21:25
Xilinx UltraScale
IBM P8
Intel Xeon E7
Размер — это не главное.
К тому же это просто корпус. Размеры которого в основном обусловлены количеством выводов и пичем и иногда — потребностью в теплоотводе. Нанометры здесь не имеют никакого значения.
Отредактировано: Антон Смоленский~22:31 01.06.17

#917857 ↑

7
Николай Черняк
01.06.1719:40:33

Где продаются в частные руки?. пока не будет массовости. так и будут говорит что угодно! дайте людям в Персональки в конце концов то!

#917807 ↑
5
yaapelsinko
01.06.1719:49:00

[обязательный камент с видом дурачка про то, а где же производятся эти процессоры, ах в Китае? ну тогда и гордиться нечем, отпилы, раскаты, и вообще раз не лучший в мире, то не стоило и делать]

#917814 ↑

1
ksey
01.06.1719:56:41

Да, ждем

#917818 ↑

7
Nguyen
01.06.1721:42:35

Да, ждем
А-а-а!.. Зделано ф Китаи, сплашныи аткаты, техпрацес жырный, мала гигагерцеф, лучи бы купили интель инсиде, а-а-а…

#917847 ↑

2
Иван Иванов 2
02.06.1701:15:56

#917881 ↑
0
liman
02.06.1704:19:51

Всё это хорошо, но «обвязка» то импортная (сколько не видел фотографий)!! хотя есть элетролиты наши к50-68, чип резисторы наши Р1-112,116, чип кондёры наши к10-67,67… и т. д.

Отредактировано: liman~04:20 02.06.17

#917892 ↑

0
~~lowly cook~~
02.06.1708:55:59

Российские чип-резисторы и керамические конденсаторы внешне ничем не отличаются от импортных. Поэтому я бы не стал делать далеко идущие выводы касательно этих компонентов по фотографиям.
Алюминиевые электролитические конденсаторы в вычислительную технику стараются не ставить, предпочитая алюминий-полимер / тантал-полимер и прочее подобное — это банки с красными метками на фото (которых российских не бывает насколько мне известно). У нас например в базе компонентов за 2 года не появилось ни одного алюминиевого электролитического конденсатора. Их ставят там где высокие напряжения и надо много емкости — в преобразователях напряжения на входе, например. Потому что найти большой полимер на напряжение выше 25В — сложно. А на обычных материнских платах самое высокое напряжение — 12В — для него все закрывают полимеры.
А что касается всех остальных компонентов. А ничего больше особо и нет российского.

Отредактировано: Антон Смоленский~09:09 02.06.17

#917936 ↑

2
ksey
02.06.1709:40:42

А что касается всех остальных компонентов. А ничего больше особо и нет российского.
СВОИ:
- «южный мост» КПИ-2, который используется с Эльбрус-8С, включает:
* контроллер PCI-Express 2.0
* 3 контроллера Gigabit Ethernet
* 8 контроллеров SATA 3.0
* 8 интерфейсов USB 2.0
* контроллер шины PCI
* интерфейс IDE
* контроллеры Audio HDA, RS-232, IEEE1284, SPI, I2C, GPIO
В процессоре Эльбрус-1С+, который так же используется совместно с КПИ-2, имеются свои:
- 2D графическое ядро
- дисплейный контроллер

#917954 ↑

-3
~~lowly cook~~
02.06.1709:45:06

Спасибо кэп.
Ну как бы это очевидно что на плате Эльбрус и его IO хаб. Было бы странно если бы там Patsburg стоял. Они всегда вместе ходят как Чип и Дейл.
Это не остальные компоненты (а не IP-ядра в камнях), о которых я говорил в предыдущем сообщении. Коллега несколько иные вещи имел в виду.

Отредактировано: Антон Смоленский~09:54 02.06.17

#917957 ↑

3
RadiantConfessor
02.06.1704:36:25

Прочитал полную статью на Хабре и комментарии. В общем подведу итог теста. Этот Эльбрус-8С по производительности в протестированных задачах должен соответствовать Skylake i7-6700K.

Отредактировано: Zveruga~04:37 02.06.17

#917893 ↑

0
Дмитрий Тёмный
02.06.1705:35:24

а если с AMDшными не Ryzen сравнить?

#917901 ↑

1
RadiantConfessor
02.06.1707:20:01

В тестировании сравнивали именно с i7-6700K. Интерполировать не буду. Вдруг ошибусь?

#917913 ↑

2
kerosene
02.06.1705:40:36

Не будет соответствовать. У него частота в 3 раза ниже. Но даже будучи в 3 раза более медленным чем Скайлейк — это все равно отличный результат для микропроцессора, на разработку которого было потрачено около 7 млн $.

#917902 ↑

2
RadiantConfessor
02.06.1707:22:52

В 3 раза медленнее чем Скайлейк Эльбрус-4С. Вот тут тестирование между Эльбрус-4С и i7-6700K. Эльбрус-4С в среднем отстаёт в 3 раза (если не учитывать тесты с SSE).
Согласно тестирования приведённого в статье топикстартера Эльбрус-8С быстрее Эльбрус-4С в 3 раза. Выходит он сравнялся по производительности с i7-6700K. Единственное что ему не хватает, так это поддержки SSE.
Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.

Отредактировано: Zveruga~07:31 02.06.17

#917914 ↑

0
Роман Рябов
02.06.1710:02:25

Интересное сравнение с интелом. радует то что наши догнали штеуд в нужных приложениях.
Только имхо сравнивать эльбрус с интелами потребительского сегмента в лоб бессмысленно. Интел делает процессоры для массового рынка, на них и поиграть, и порендерить, и посчитать можно. Эльбрус сделан под строго определенные задачи и в них хорош. Но ждать его в массовом рынке не стоит. Нестандартная архитектура это раз, и второе, сегмент настольных пк умирает.Эльбрус будет все еще нужен для ЦОДов и в оборонке для пк, но на выход в открытый рынок надежды мало,да и не нужно оно. А есть сравнение серверов на эльбрусе и интелах? Вот это весьма любопытно.

#917971 ↑

3
RadiantConfessor
02.06.1710:48:29

Зато сегмент серверов развивается.
Эльбрус будет все еще нужен для ЦОДов
Не всё ещё, а наверное навсегда.
Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.

#917987 ↑

-2
~~lowly cook~~
02.06.1711:39:01

Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.
Там нужно много памяти для in-Memory применений и/или быстрый интерконнект для распределенных вычислений.
Я бы не сказал что это просто, когда ни того ни другого — нет.
Да и как-то странно рассуждать о выходе на мировой рынок серверов и при этом сравнивать себя с десктопным процессором.
Да — и там конечно же нужны драйвера под крутые видеокарты, просто не игровые.
Нет, боюсь экспортные перспективы да еще и в массовом сегменте у Эльбруса — нулевые.

Отредактировано: Антон Смоленский~12:34 02.06.17

#918011 ↑

3
ksey
02.06.1711:48:57

Интерконнект есть — Высокоскоростная сеть «Ангара» для суперкомпьютеров и кластеров:
Сетевой адаптер представляет собой плату расширения PCI Express (аналогично сетевым адаптерам InfiniBand), к которой подключается до 6 (или до 8, с платой расширения) кабелей для соединения с соседними узлами. Поддерживаются топологии сети без коммутаторов: кольцо, 2D, 3D и 4D-тор (либо решётка); в общем случае передача данных между узлами может осуществляться через промежуточные узлы.
Основной режим программирования — совместное использование MPI, OpenMP и OpenSHMEM; также поддерживаются другие модели программирования, в том числе Charm++, GASNet, ARMCI, UPC. Для поддержки OpenSHMEM и PGAS-языков на каждом узле выделяется регион памяти, доступный для удалённых обращений (чтения, записи, атомарных операций) от других сетевых узлов. Сеть «Ангара» совместима с коммерчески доступными процессорами и материнскими платами.
СБИС сетевого адаптера (ЕС8430) была разработана в АО «НИЦЭВТ» и изготовлена на фабрике TSMC по технологии 65 нм. Плата сетевого адаптера изготавливается на собственном производстве в АО «НИЦЭВТ».

Отредактировано: ksey~11:50 02.06.17

#918013 ↑

0
~~lowly cook~~
02.06.1711:51:15

Я прям себе живо представил как Гугл или Амазон рассуждает что бы поставить в ЦОД — IB HDR или Ангару. Очень непростой выбор надо сказать.
Экспортные перспективы Ангары также туманны как и Эльбруса.
Но я в общем-то говорил немного о другом. Я говорю том что у Эльбрус PCIe Gen2 (5GT), а на дворе уже Gen4 (16GT). У процессора нет быстрого интерконнекта. Адаптер то можно любой поставить — не об нем речь.

Отредактировано: Антон Смоленский~12:07 02.06.17

#918015 ↑

1
ksey
02.06.1712:12:17

Сейчас не идет речь об экспортных перспективах. На первых порах нужно по максимуму обезопасить страну от различных «подлянок» со стороны запада.

#918027 ↑

0
~~lowly cook~~
02.06.1712:15:58

Взойти на мировой рынок серверов гораздо проще, там не нужны драйвера под крутые видеокарты и поддержка современных видеоигр.
Напоминаю что в данной ветке как раз об них речь и идет. А про «обезопасить» и «подлянки» — я ничего и не говорил. Меня эта тема мало интересует.

Отредактировано: Антон Смоленский~12:19 02.06.17

#918029 ↑

2
RadiantConfessor
02.06.1719:52:44

Гугл или Амазон
Зачем? После того как Т-платформы залезли на рынок США и эта страна прямым недвусмысленным указом показала, что она не допустит конкурентов на свой рынок, соваться туда нет смысла. А вот на рынок ОДКБ и ШОС есть смысл.
Не все в мире доверяют Гугл и Майкрософт.

Отредактировано: Zveruga~19:53 02.06.17

#918168 ↑

0
~~lowly cook~~
02.06.1720:04:40

Зачем? После того как Т-платформы залезли на рынок США и эта страна прямым недвусмысленным указом показала, что она не допустит конкурентов на свой рынок, соваться туда нет смысла.
Не совсем. Более популярная версия — что это HP отомстил за проигранный тендер в Юлихе — туда Ломо-2 должны были ставить, то есть все по взрослому. А правду знает только Всеволод Юрьевич и госдеп. То что там поставили в США — достаточно незначительный проект на самом деле. Просто в СМИ так преподнесли — мол ура, наши продались в США.
Ну и собственно если ты не заметил — Т-Платформы больше не занимается этой тематикой. Они полностью ушли в Байкал и решения на нем. Да и там некому собственно уже. А посколько они были единственные у нас — то в общем-то никто вообще не занимается. Ну если не считать интеграторов, которые ставят решения на HP/Dell и прочем таком.
Но не суть.
Ты ж сам заговорил про мировой рынок серверов. А это США и Китай. Все.
Причем китайский рынок гораздо более жесткий. В США продавать проще. Ну и суперкомпьютерная тематика она полностью под гос. контролем везде, во всех странах. И скорее имиджевая чем коммерческая. Деньги зарабатывают продаваясь Гуглам, Амазонам, банкам и прочим подобным.

Отредактировано: Антон Смоленский~20:26 02.06.17

#918170 ↑

3
RadiantConfessor
02.06.1720:53:11

В их судах сидят патриоты националисты , которые защищают интересы своей страны. Их власть поддерживает их коммерсантов.
Вся экономика США выросла благодаря противостоянию СССР. США объединилась с Европой на почве противостояния коммунизму и в первую очередь они взаимодействовали за счёт оборонной экономики. То есть НАТО это фактически такой рынок, который существует за счёт денег вливаемых в оборону НАТО. После распада СССР этот рынок стал глохнуть, ЕС уже неохотно вливается деньгами, заказы на F-35 это показывают и Трамп решил изменить эту ситуацию. С ЕС он решил трясти процент, заключил огромный договор с арабами.
Вот и нам следует использовать их опыт, не исключать этот путь в высоких технологиях. По этому думаю следует смотреть на рынок ОДКБ сейчас и на рынок ШОС в будущем.
По этому США оттуда исключаем, ЕС исключаем, это всё страны НАТО. Смотрим на Китай и Индию, как крупнейших партнёров. Параллельно подключаем в эту схему Иран, Пакистан, Бангладеш и Мьянму. Иран будет первым в этой очереди. Его НАТО недолюбливает, гайки ему закручивает, значит нам сейчас важно заключать договоры военно-технического сотрудничества с этой страной.
Убедим Иран поставлять нефть и газ в Индию. Сами будем тянут трубу в Китай. Замкнём это торговое кольцо
Россия-Китай-Мьянма
Россия-Туркменистан-Иран-Пакистан-Индия-Бангладеш-Мьянма
Получим половину населения планеты и большую част денег мира. Больше чем есть у всего НАТО!

Отредактировано: Zveruga~20:55 02.06.17

#918184 ↑

2
RadiantConfessor
02.06.1711:54:20

Свой оптический интерконнект мы уже создали.
МЦСТ как раз постоянно дистанционирует себя от десктопных процессоров, но общественность почему-то требует от него поддержки офисных и домашних задач. А они тем временем клепают потихоньку четырёхпроцессорные серверы для государства.
Экспортные перспективы появляются уже с Эльбрус-8С в пределах ОДКБ, так как обеспечивают защиту от НАТО. Если появится Эльбрус-16С и Китай с Индией нам поверят, тогда мы выйдем и на рынок ШОС. А это половина населения планеты и большая часть денег в мире.

Отредактировано: Zveruga~11:55 02.06.17

#918016 ↑

-1
~~lowly cook~~
02.06.1711:58:37

Не люблю повторяться, но сделаю исключение.
У самого Эльбруса нет быстрого интерконнекта.
Российские решения по интерконнекту как-то Ангара — это тема отдельной дискуссии. И я в ней не очень силен. Моя тема в данном контексте — это Bandwidth, а не сетевые топологии. Хотя я думаю когда BW отличается в несколько раз — клевой сетевой топологией уже не отделаться.
Ты ж говоришь о мировом рынке, а не о внутренних потребностях. На мировом рынке наши решения ни на Эльбрусе ни на Ангаре мало кого заинтересуют. Только если с академической точки зрения — изучить и сделать свое в 5 раз быстрее. Там утрирую — взять идеологию Ангары и запилить её на 56G сердесах — вот такое на мировом рынке будет интересно.
Экспортные перспективы появляются уже с Эльбрус-8С в пределах ОДКБ, так как обеспечивают защиту от НАТО. Если появится Эльбрус-16С и Китай с Индией нам поверят, тогда мы выйдем и на рынок ШОС.
У Китая есть свои процессоры, гораздо серьезнее, а еще они бегают по всему миру и лицензируют все подряд. Боюсь не стоит расчитывать на продажу процессоров в Китай. Я думаю скорее будет наоборот — мы начнем закупать ихние.

Отредактировано: Антон Смоленский~13:33 02.06.17

#918021 ↑

1
RadiantConfessor
02.06.1719:28:46
Если Интерконнект втыкается в PCI-E 3.0×8 слот думаю и ширины канала будет предостаточно, и к Элбрусу его можно беспроблемно прикрутить.
Отечественным оптическим интерконнектом у нас является Паутина. Скорость передачи на один кабель 56 Гбит/с. Таких кабеля в каждой плате два. Внешний маршрутизатор или коммутатор не нужен. Вся маршрутизация осуществляется на плате интерконнекта.
У Китая есть свои процессоры
Да, они это умеют и даже свои суперкомпьютеры строят, но ничего неизвестно про их собственные интерконнекты. Их Goodson/Loongson это MIPS архитектура в отличие от уникального Эльбруса. x86 их процессор не поддерживает, а эта фича помогает в наладке/отладке систем и расширяет спектр применения. В производительности они не особо далеко ушли. Выходит наша задача показать чем мы лучше. Для этого нужно сравнивать их ЦОД и наши. Мы уже умудрялись выигрывать иностранные тендеры на построение ЦОД даже в США, значит нам есть что показать миру в этой области.
Отредактировано: Zveruga~19:30 02.06.17

#918155 ↑

-1
~~lowly cook~~
02.06.1719:38:32

Если Интерконнект втыкается в PCI-E 3.0×8 слот думаю и ширины канала будет предостаточно, и к Элбрусу его можно беспроблемно прикрутить.
Отечественным оптическим интерконнектом у нас является Паутина. Скорость передачи на один кабель 56 Гбит/с. Таких кабеля в каждой плате два. Внешний маршрутизатор или коммутатор не нужен. Вся маршрутизация осуществляется на плате интерконнекта.
1) нет у Эльбруса PCIe Gen3 — о чем я собственно и пишу уже в 3 сообщении подряд. А это не то что там USB3.0 который хер поймешь нужен или нет вообще, а весьма серьезный недостаток для системы, которая позиционирует себя как серверная.
2) 8 x 8GT/s = 64GT/s. Вопрос — как 2×56GT/s будут работать с 64GT/s слотом? Но это не существенно на самом деле — так. Коннектор можно и пошире конечно, детали реализации.
3) У них там FPGA под радиатором. ~~Вероятно Xilinx с ценой как у Боинга~~. Alterra за 4.5k$. То есть решение не рыночное — а прототип. Рыночное решение будет, когда/если будет ASIC с ~~56G~~ 14G SerDes. Двухпортовые Адаптеры IB FDR (те же 2×56G) нынче продаются за 1.5k$ за адаптер, причем 50% я думаю это маржа Mellanox. Двухпортовые IB HDR 2×100G адаптеры уже штучно понапроданы всяким монстрам и скоро пойдут массовкой.
Даже с учетом того что я несколько прогнался и кое-что поправил — рано для покорения мира.

Отредактировано: Антон Смоленский~20:42 02.06.17

#918161 ↑

1
RadiantConfessor
02.06.1720:32:16

нет у Эльбруса PCIe Gen3
А ведь и правда нет. КПИ-2 поддерживает Gen 2. Значит, чтобы реализовать Эльбрус на Паутине придётся ждать Эльбрус-16С, а это ещё два года.
Вопрос — как 2×56GT/s будут работать с 64GT/s слотом? Но это не существенно на самом деле — так. Коннектор можно и пошире конечно, детали реализации.
Дак это, эта плата она же и коммутатор в одном лице. То есть она принимает чужой трафик, которой не предназначен для неё и проталкивает дальше по сети, по другому проводу. По этому часть данных на шину даже не попадает.
У них там FPGA под радиатором. Вероятно Xilinx с ценой как у Боинга. Alterra за 4.5k$. То есть решение не рыночное — а прототип.
Да, на ПЛИС. Но это не прототип. Создано для реального использования в наших суперкомпьютерах. Мы ведь даже целые суперкомпьютеры на ПЛИС создаём и довольно успешные. Нам пока нет необходимости свой специализированный процессор для этих задачь пилить, дешевле ПЛИС использовать. Но сам разработчик уже заявлял, что если понадобится выпустят и свой процессор.
Паутину на экспорт в дальнее зарубежье пока ещё не предлагают. Мы только только на рынок ОДКБ заходим. Ведь её создавали для военных, а ОДКБ это оборонная структура.
Когда ШОС объединится в оборонную структуру на подобие НАТО (а я в это искренне верю), тогда рынок Паутины и Эльбруса серьёзно расширится.

Отредактировано: Zveruga~20:36 02.06.17

#918177 ↑

0
~~lowly cook~~
02.06.1720:46:11

Значит, чтобы реализовать Эльбрус на Паутине придётся ждать Эльбрус-16С, а это ещё два года.
А разве там будет Gen3 внутри?
Насколько я понял не Эльбрус-16С наверное надо ждать, а КПИ-3?

#918182 ↑

0
RadiantConfessor
02.06.1720:56:33

Говорят южный мост в Эльбрус-16С будет интегрирован в процессор. Но это пока только слухи.
Мыж графическое ядро в процессор не суём, места на чипе должно хватить.

Отредактировано: Zveruga~20:57 02.06.17

#918186 ↑

1
Tuck Trucker
02.06.1712:56:33
Согласно тестирования приведённого в статье топикстартера Эльбрус-8С быстрее Эльбрус-4С в 3 раза.
Где вы такой вывод нашли?
Там тесты в пересчёте на 1 ГГц то есть результат i7-6700 разделён на 4, а Эльбрус-4С умножен на 1.25.
i7-6700 выдаёт на тестах 230 Гигафлопс двойной точности
Максимальная производительность Эльбрус-8С — 125 Гигафлопс двойной точности.
То есть он полюбому в 2 раза менее производителен. Конкуренцию i7-6700 Эльбрус составит только с выходом Э8СВ с удвоенной производительностью на такт.
Э8С даёт прирост в однопоточных тестах меньше 2 раз, по сравнению с Э4С, потому что рост в основном за счёт частоты. Поэтому прирост во многих приложениях будет не 3 раза.
Вот сравнение Эльбрус-4С и i7-2600 в 7zip
http://zoom.cnews.ru/publication/item/51820/3
Intel Core i7-2600 Эльбрус-2C+ Эльбрус-4С
Архивация по алгоритму 7zip (сжатие), Мбайт/с 3,95 0,543 0,665
Архивация по алгоритму 7zip (распаковка), Мбайт/с 33,437 6,296 8,679
3.95/0.665 = ~6 раз медленнее Э4С чем i7-2600
Ну, а в этом обзоре ещё одно сравнение Э4С и i7-2600
https://geektimes.ru/post/270390/
Отставание скачет от нескольких раз до десятков раз.
А вообще сравнивать четырёхядерные процессоры и 8 ядерные неверно, из-за сильной зависимости результата от оптимизации под многопоточность. Разница до двух раз может быть не в пользу Эльбруса. Эльбрус-8С надо с восьмиядерным ryzen-1800x сравнивать. АМД тоже идут по пути много более простых ядер в ущерб частоте.
Отредактировано: Tuck Trucker~13:33 02.06.17

#918043 ↑

2
RadiantConfessor
02.06.1719:55:20

Там цифры не только в пересчёте на 1 ГГц, но и реальные. Вот их и сравнивайте. Начните с самой первой таблицы.
В Эльбрусе-8С не только частота и количество ядер выросли, но и архитектура улучшилась.
Ну и про наличие SSE в Intel не забывайте, о чём я упоминал. На Эльбрус-16С должен появиться аналог для вычислений с широкими данными.
О чём говорят приведённые тесты сравнения Элбрус-4С и I7-7600K? В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше, а значит, если мы усовершенствуем АЛУ, наш процессор обгонит Интелы по производительности.

Отредактировано: Zveruga~20:00 02.06.17

#918169 ↑

0
Tuck Trucker
06.06.1700:26:02

Единственный тест без пометки о пересчёте.
https://habrahabr.ru/comp...smartengines/blog/317672/
Пример 6. Многопоточные вычисления
Э4С выполнил его за 13170 мс
6700 выполнил его за 2528 мс
13170 / 2528 = 5.2 раза Э4С медленнее. Где те «в 3 раза медленнее i7-6700» о которых вы говорили?
В целочисленной арифметике с простыми данными (до 64 бит) наша архитектура показала себя лучше
Дайте ссылку, на примеры.
Есть хороший тест, как раз на целые числа, называется 7zip(http://www.7-cpu.com).
Выше я дал цифры(http://zoom.cnews.ru/publication/item/51820/3)
3905/665 = ~6 раз медленнее Э4С чем i7-2600.
Если мы опустим i7-2600 до частоты Э4C, получится 3.8 ГГц/0.75 ГГц= 5(в 5 раз меньше частота у Э4С)
3950*(1/5) = 790 был бы результат у i7-2600 на частоте Э4С в тесте 7zip, у Э4С на этой частоте результат 665.
665/790*100 = 84% даёт производительности Э4С от производительности i7-2600.
То есть производительность Эльбрус чуть ниже производительности Интела на частоте Эльбруса и в 5-6 раз на собственных частотах процессоров( в лучших случаях). И если производительность Э8С в 3 раза выше, то он не догонит в этом тесте i7-2600, и тем более i7-6700.
Ну и для сравнения
Э4С 665*4= 2660
Intel® Celeron® CPU G1610 @ 2.60GHz 2 ядра (цена 2.5 т.р) 5243
Э8С (прикидка) 665*8*(1300/750) = 9221
если просто на 3 умножить 2660*3 = 7980
i7-2600 3888*4 = 15552(4 потока)
i7-6700 24700
AMD Ryzen 1800х 38000
(https://www.servethehome.com/wp-content/uploads/2017/03/AMD-Ryzen-7-1800X-7-zip-Compression-.jpg)

Отредактировано: Tuck Trucker~01:29 06.06.17

#919084 ↑

0
RadiantConfessor
06.06.1702:03:47
Из той же статьи, которую ранее привёл я, а теперь и вы. Самая первая строка в первой таблице.
Эльбрус-4С 401 мс
Intel Core i7 255 мс
Разница в 1,6 раз.
Отсюда разница в скорости различается в определённом диапазоне. Я считаю, что в среднем эта разница в три раза. При этом напомню сказанное мной выше, читайте внимательно:
Единственное что ему не хватает, так это поддержки SSE.
Но это не гарантия, что так будет во всех задачах. Гарантия только на определённый круг задач, которые прошли тестирование.
То есть есть определённые задачи, в которых тестировали Э4С и в каждой задаче тесты разнятся. Причины расхождений связаны:
1. С неоптимизированным кодом тестов на Э4С.
2. Отсутствием SSE.
Реальная производительность Э4С в задачах обрабатывающих узкие данные (не более 64 бит) отличается от i7-6700K в среднем в три раза. Следовательно с появлением Э16С, если в нём будет присутствовать набор команд для обработки «широких» данных производительность обгонит современные процессоры Интел в пересчёте на одно ядро.
Отредактировано: Zveruga~02:05 06.06.17

#919096 ↑

0
Tuck Trucker
06.06.1714:50:29

Насколько я знаю SSE(а сейчас это уже AVX называется у Интел) на Эльбрусах не планируется. Упор идёт на увеличение числа инструкций за такт. В Э8СВ будет уже 50(правда из них только часть «вычислительных»). При ожидаемых 1.5 ГГц у Эльбрус-8СВ ожидается порядка 250 Гфлопс(32 Гфлопс на ядро), А от Э16С при ожидаемой частоте 2 ГГц, будет 32*(2/1.5) = 42 Гфлопс на ядро. У i7-6700 получается 230/4 = 57,5 Гфлопс на ядро. Для целых чисел результат аналогичный. Ко времени выхода Э16С у Интел появится AVX-512(уже в этом году будет в Xeon Skylake EP/EX и в следующем поколении Cannonlake). Производительность вырастет в 2 раза, до порядка сотни Гигафлопс на ядро. То есть он будет отставать в любом случае.
95% софта под которым будет работать Эльбрус не будет написан для него с нуля. За основу взят Линукс. Поэтому оптимизация будет отставать от идеальных тестов к сожалению.

#919304 ↑

0
RadiantConfessor
07.06.1703:18:05

Чтобы сделать вычисление «широких» данных необходимо их предварительно загрузить в специальный регистр. Так как команда в Эльбрусе уже широкая, то это позволяет вместе с командой сразу загружать весь необходимый набор данных. Единственным ограничением является количество функциональных блоков в АЛУ.
Если у Эльбрус-8СВ количество подгружаемых за такт команд и данных вырастает в два раза, тогда производительность действительно возрастает в два раза. Но если ещё и частота вырастает на 200 МГц, тогда производительность дополнительно поднимется на 15%, составив 288 ГФлопс двойной точности. Это 36 ГФлопс на ядро. Тогда у Эльбрус-16С с его частотой 2 ГГц будет 48 ГФлопс на ядро.
У i7-6700 хоть и 4 физических ядра, но у него 8 наборов АЛУ. То есть четыре конвейера на каждом из которых по два набора АЛУ. Как считать такие ядра? Они как двуглавые гидры. Но для честности всё же придётся учесть, что у процессоров Core с гипер трейдингом такие особенные навороченные ядра.
Но есть один момент, расширение команд AVX увеличивает производительность только на этих командах, а расширения ширины команды в Эльбрусе предполагает и увеличение числа обрабатываемых за такт простых команд! Конечно для этого придётся в два раза увеличить АЛУ, но им есть куда его увеличивать, так как у МЦСТ на кристалле место не занято конвейером с предсказателем. Вся обработка идёт в момент компиляции. Следовательно процессор Эльбрус при росте ширины команды увеличивает производительность во всём спектре вычислений, а Core только в определённом классе задач связанных с командами AVX.
То есть если Эльбрус-16С и будет отставать в пиковой производительности, то будет более быстрым в реальной производительности.
Сама концепция предварительной компиляции говорит о том, что удельные энергозатраты на вычисление у Эльбруса всегда будут ниже чем у Сore при равных технологиях производства.
Что же касается программного обеспечения, то по большей части здесь играет роль компилятор. Спектр задач для Эльбруса в ближайшем будущем не такой уж и широкий, чтобы нужно было много оптимизировать кода. Тоже самое затрагивает и Интел с их AVX. Там необходимо переписывать задачи для применения новых команд. То есть и под Интел с новыми командами программ будет не так много.

Отредактировано: Zveruga~03:26 07.06.17

#919495 ↑

0
Александр Демьянов
02.06.1709:51:53

Это и частота 1300 МГц, и 25 операций за такт на ядро.
Не совсем так:
1. «Это и частота 1300 МГц, и 25 операций за такт на ядро."
2."Особенностью VLIW является то, что в каждой команде процессора может содержаться до 23 элементарных операций, которые должны исполняться параллельно."
Это означает что при выполнении задач написанных под конкретный процессор, Эльбрус получает огромную производительность по сравнению с X86. Что, правда, требует создание как минимум компилятора который будет переписывать код из исходника, а фактечески преписывать всё ПО.

#917962 ↑

1
RadiantConfessor
02.06.1720:23:47

В Э4С было 23 команды на такт. В Э8С 25 команд на такт. Архитектура на месте не стоит, развивается.

#918176 ↑
0
Виктор Гюго
07.06.1714:59:50

> а фактечески преписывать всё ПО.
компилятор и базовые библиотеки.

#919728 ↑

Комментарий удален

Написать комментарий

Отмена

Для комментирования вам необходимо зарегистрироваться и войти на сайт,