Улучшенный чип AX-серии для новых iPad

Графика и LTE модем

Что касается графики, оба чипсета использую свою собственную графическую систему. У Qualcomm Snapdragon 821 — это Adreno 530 GPU с тактовой частотой 650 МГц. Apple ранее использовала графику PoweVR GPU от компании Imagination Technologies. Но с процессором 10 Fusion она перешла на графический чип собственной разработки на 6 ядер. Официального названия у графики Apple до сих пор нет.

Snapdragon 821 поддерживает OpenGL ES 3.2 и Vulkan 1.0, в то время, как A10 Fusion — OpenGL ES 3.0 и Metal API (собственную разработку Apple). Еще одним различием между чипсетами является поддержка быстрой зарядки Quick Charge 3.0 в SD 821 и ее отсутствие в Apple. Также SoC Snapdragon 821 имеет встроенный на кристалле модем X12 LTE, в то время, как Apple A10 не имеет встроенного LTE модема и использует стороннее решение на отдельном чипе.

Два ядра хорошо, а четыре лучше

Вместе с добавлением двух дополнительных ядер была добавлена:

  • Система изменения частоты и напряжения в реальном времени, причем, с отключением как целых ядер, так и отдельных вычислительных блоков. Это дало много гибкости как в энергопотреблении, так и в производительности процессора;
  • В iPhone 7 был добавлен новый контроллер, позволяющий более эффективно распределять нагрузку между ядрами или загружать только некоторые из них
  • Была создана специальная схема деления кэш-памяти процессора на каждое из ядер, что позволяет, когда это необходимо, отдельному ядру решать задачи самостоятельно, не обращаясь при этом к кэш-памяти других ядер
  • Ну, и конечно был увеличен в два раза размер третьего уровня кэша памяти процессора с 4 до 8 мегабайт.

Производительность

Процессор Snapdragon 821 можно посчтитеть более производительным, так как для сравнительно одинаковой архитектуры и частоты, он построен на меньшем технологическом процессе (14 нм против 16 нм). Также это положительно скажется на меньшем потреблении энергии. Но в популярных бенчмарках, вроде AnTuTu, Geekbench и Basemark OS III, Apple A10 Fusion набирает большее количество баллов, чем SoC от Qualcomm.

Стоит отметить, что производительность будет еще разниться от устройства к устройству, ведь производители используют разную степень оптимизации железа и софта, а также разный «обвес» процессора: оперативная и флеш-память и прочее.

Большая МАЛЕНЬКАЯ архитектура

В 2011 году в секторе процессоров для мобильных устройств сложилась революционная ситуация. С одной стороны, чтобы не проиграть в жесточайшей конкурентной борьбе, их вычислительную мощь приходилось наращивать. А за все в мире надо платить. Большая мощь – это удлинение конвейеров, увеличение размеров кэшей всех уровней, умножение числа вычислительных юнитов. И стремительный рост числа транзисторов на кристалле, потребляющих энергию даже в состоянии “сна”.

Пиковые нагрузки, ради которых собирали всю эту рать, были эпизодическими. Большую часть времени многомиллионные армии микроскопических переключателей потребляли, дремали и ждали своего часа. Точнее, мига. Батареи разряжались все быстрее, отходы жизнедеятельности миллионов транзисторов (выделяемое ими тепло) требовалось как-то “вывозить”, иначе системе наносился непоправимый ущерб.

Так или иначе, с чем-то похожим в микроэлектронике уже сталкивались. Intel и AMD нашли собственные решения похожим проблемам, о том как это им удалось, в изложении для тех кто использует процессоры, было хорошо и широко известно. А вот конкретная суть этих решений, понятное дело, была самой охраняемой тайной лидеров отрасли.

ARM Holdings предложила своё решение: использовать в процессорах неодинаковые ядра, с разной производительностью и энергоёмкостью. “Большие”, для пиковых нагрузок, и “маленькие”, для всего остального. Архитектуру назвали big.LITTLE, и рассказали о ней в октябре 2011 года. Препятствий на пути к реализации мира вселенской мечты было много: процессор с этой архитектурой надо было научить вовремя и очень быстро включать и выключать большие или маленькие ядра. Это только верхушка айсберга, на самом деле чтобы вся эта механика заработала, процессорам требовалось освоить массу непростых трюков.

Оборотная стороны – амбициозные задачи вроде этой просто находка для талантливых инженеров, отличная возможность многому научиться, попробовать свои силы, и в конце концов это безумно интересно. А еще – каждый такой проект делает мир немного умней. И одновременно глупей (тут тоже big.LITTLE), но не будем о грустном.

Чтобы играть в эти игры, ядра обоих типов требовалось разрабатывать заново, с учетом участия в этой игре.

Стремительно-быстрое переключение между режимами занимало 20 тысяч циклов CPU. Даже при тактовых частотах в 500 МГц (в 2011 встречались и такие) это 400 микросекунд.

Изначально предполагалось что переключение будет “кластерным”, в каждую единицу времени процессор будет использовать только “большие ядра”, или только “маленькие”. 20 тысяч циклов – это цена за такой подход.

В процессе использования этой архитектуры, возникли еще два способа её применения. Переключение могло случаться независимо, в единственной паре большой-маленький, в зависимости от потребностей выполняемой этой парой задачи. И даже, хитрым и не очень элегантным образом, большим и маленьким разрешалось иногда работать одновременно.

У каждого из трех способов свои плюсы и минусы. Инженеры Apple выбрали простой и самый экономичный способ: переключаются сразу все, в любой момент работают либо только “большие”, либо только “маленькие”. Практическое число ядер при этом подходе равно половине от их физического числа – зато на порядок меньше причин ошибиться.

2-ядерный 4-ядерный процессор – это Apple A10 Fusion и некоторые его родственники. Практика – критерий истины. Топовые позиции в тестах (и в самых реалистичных, в том числе) сделали спекуляции об отсталости и интеллектуальной недостаточности Apple беспочвенными. Но уверяю вас, инженеры Apple тратили силы и время вовсе не на это.

Архитектура big.LITTLE – самое главное и заметное отличие процессора в Apple A10 от его предшественника. Но не единственное. Вокруг этой архитектуры возникло такое число предрассудков и заблуждений, что пришлось уделить ей столько времени. Извините, если что.

Устройства с А10 на борту

iPhone 7 и iPhone 7 Plus

Очень похожие дизайном на своего предшественника, но при этом во многом благодаря Apple А10 Fusion процессору более производительные смартфоны, которые даже в 2019 году справляются на отлично с большинством приложений и мобильных игр.

Единственный значительный минус семерки, по сравнению с Plus версией – урезанный с трех до двух гигабайт объем оперативной памяти.

iPad 6 (2018)

Недорогой, бюджетный планшет, который действительно позиционирует себя как планшет. Ведь если взять тот же ультрасовременный iPad 10,5 того же (2018) года выпуска, который намного более мощнее – он может заменить собой ноутбук или даже ПК.

Однако не так уж и много людей, которые готовы полностью отказаться от ПК в пользу планшета. Зато людей, которым нужен сравнительно недорогой и производительный девайс для дороги, на котором можно почитать книжку или посмотреть фильм — более чем предостаточно.

Вот для них iPad 2018 подойдет лучше всего. Особенно если учесть, что время его автономной работы благодаря Apple A10 достигает 10 часов.

Консультант сайта appleiwatch.name, соавтор статей. Работает с продукцией Apple более 10 лет.

Графика от Apple?

Фил Шиллер, в ответ на вопросы журналистов, еще в 2016 году, подтвердил: Apple вносит изменения в графические процессоры от PowerVR. Легально и официально. И уже давно.

Внедрение Metal усилило эту тенденцию. Обе SoC, Apple A10 Fusion и Apple A10X Fusion, в тестах использующих Metal были значительно эффективнее, чем в тестах с OpenGL или OpenCL. Только Apple могла оптимизировать работу GPU с новыми версиями Metal, пока еще совершенно секретными.

О том что в отделении микроэлектроники Apple создается полноценное подразделение для разработки графических процессоров, хоть это и считалось закрытой информацией, знали и эксперты, и журналисты. Без каких-либо утечек.

Вакансии с очень специфическими требованиями, модернизация GPU от PowerVR, наконец подозрительное невнимание Apple к PowerVR серий 8XE и 8XE Plus в 2016 и 2017 годах. И это невнимание было взаимным: в 8XE и 8XE Plus не поддерживался Metal

12-ядерный PowerVR Series 7XT GT7600 Plus в Apple A10X Fusion был всего в полтора раза производительнее чем 12-ядерный PowerVR Series 7XT GTA7850 в Apple A9X (“A” в “GTA” указывает на большее чем обычно участие Apple в его разработке). PowerVR не подвела, её стандартный GPU в 12-ядерной конфигурации позволял Apple A10X Fusion брать призовые места – но для категории “самый-самый”, на которую эту систему-на-чипе номинировала Apple это казалось недостаточным.

А еще, про PowerVR Series 7XT GT7600 Plus почти ничего не сказали во время презентации. Обозреватели уже знали что это последний GPU от PowerVR в Apple Ax. В Apple A11 ждали GPU “яблочной” разработки.

Сторонние наблюдатели заявляли что это невозможно. Достойную графику Intel удалось (или не удалось – я встречал и такое мнение) создать за 20 лет напряженной работы. Это особенное направление в микроэлектронике, и всяким выскочкам (Apple) с этим ни за что не справиться. Но пусть де попытаются – мы посмеёмся.

Но…

Продолжение следует, а пока обсудить историю Apple вы можете в нашем Telegram-чате.

Сравнение характеристик

Snapdragon 821 A10 Fusion
Тех процесс 14 нм 16 нм
Ядра 64-бит, 4 ядра 2x Kryo 2.4 ГГц + 2x Kryo 2.0 ГГц 64-бит, 4 ядра, 2x Hurricane 2.34 ГГц + 2x Zephyr
Вычисления на ядро на кластер
Графика Adreno 530 GPU 650 МГц 6-ти ядерная графика
тип ОЗУ LPDDR4, 1866 МГц LPDDR4
4G LTE X12 LTE Cat 12/13 нет данных
Зарядка Qualcomm Quick Charge 3.0 нет данных
Поддержка графики OpenGL ES 3.2, Open CL 2.0,
Vulkan 1.0,
DX11.2
OpenGL ES 3.0, Metal
Видео запись 4K Ultra HD видео с частотой кадров в секунду 30 fps. Проигрывание 4K/30fps видео запись 4K Ultra HD видео с частотой кадров в секунду 30 fps. Проигрывание 4K/30fps видео
Кодеки H.264 (AVC) +
H.265 (HEVC)
H.264 (AVC) + H.265 (for Facetime?)
Wi-Fi 802.11ac 802.11ac

Артефакт из Фруктовой галактики

Кроме инженеров Apple и ARM, оторвавшихся по полной в процессе создания Apple A10, и пользователей получивших в свои руки продукт высоких технологий и вдохновения, были и другие счастливчики, испытавшие ни с чем несравнимое удовольствие от раскрытия очень непростых загадок природы. Про Apple A10 Fusion в концертном зале имени Билла Грэма сказали много слов, и не сказали практически ничего.

Вы еще тратите время на пошлые ребусы и кроссворды?

Расшифровать подробности и доказать правильность своей интерпретации было очень непросто, это требовало высочайшей квалификации и глубоких знаний. На этом пути было сделано много ошибок – которые были исправлены, со временем.

Даже сверхсовременный и дорогущий комплекс технических средств, включающий в себя мощный электронный микроскоп, не способен дать окончательный ответ на все вопросы.

Первая расшифровка снимков с “обратной стороны рукотворной Луны” была ошибочной, именно она опубликована в большинстве очерков о новой системе-на-чипе:

Неверная расшифровка:

К чести для ребят из Chipworks, они сомневались в её правильности. Признать её точной мешала нелогичность и отсутствие элегантности получавшейся картины. У Apple другой почерк. Поэтому – знаки вопроса.

Напряженная работа ума, дискуссии, сравнение фрагментов открывшегося ландшафта экзопланеты Apple A10 Fusion с другими ландшафтами, точные сведения о которых были приведены в технической документации иных миров (других компаний) помогли раскрыть истинную суть вещей.

Верная расшифровка:

Это тоже гипотеза. Apple не комментировала открытие добровольных исследователей, но на этот раз расшифровка более правдоподобна, лучше согласуется с результатами тестов и на 99,9% истинна.

В нашем мире есть место подвигу!

Ураган и Бриз

Тайной было не только расположение объектов на кристалле A10. Почти все. Процессор был разработан Apple для Apple. Для возбуждения интереса в массах о нем нельзя было не рассказать, но только самое интересное.

Остальное – результат напряженной работы десятков (сотен?) неплохих умов, доказанный и перепроверенный по всем правилам настоящей науки. Спасибо им.

В миру процессор (кодовое наименование T8010, видимо) назвали Cyclone-4. Четвертое поколение 64-битных процессоров от Apple. Заодно выяснили что именно извлекалось из plist-файлов в прежних версиях iOS. Это было имя ядер процессоров. И Swift, и Cyclone – это названия ядер. Пока он были в точности одинаковыми, это не имело значения. Теперь все было иначе.

Большие и прожорливые ядра назывались Hurricane. Ураган. Кроме одного из типов ядер в Cyclone-4 так назывался еще и британский истребитель Второй Мировой, Харрикейн. Это и в самом деле были большие ядра, на кристалле каждый из них занимал 4,18 кв.мм.

Максимальная тактовая частота Hurricane – 2,34 ГГц (в неблагоприятных условиях, при перегреве например, частота притормаживалась).

Маленькие назывались Zephyr. Помимо очевидного, у этого слова есть и другие значения, например – “легкий ветерок”, “бриз”. Площадь каждого из маленьких – 0,78 кв.мм.

Максимальная тактовая частота Zephyr – 1,05 ГГц.

Внутри корпуса, защищающего кристалл от повреждений и коррозии, использовалась новая технология компоновки элементов от TSMC, InFO. В корпусе, помимо кристалла, размещалась оперативная память производства Samsung. Либо 2 Гигабайта LPDDR4, в версии для iPhone 7, либо 3 Гигабайта – в iPhone 7 Plus.

Крышка корпуса Apple A10 Fusion для iPhone 7 Plus:

На крышке корпуса одна из криптограмм обозначала объём памяти. K3RG1G10CM-YGCH в случае конфигурации с 2 ГБ, и K3RG4G40MM-YGCH – в случае с 3 ГБ.

Система-на-чипе выпускалась TSMC, по технологии FinFET 16 нм. С Samsung не стали связываться – еще один Чипгейт Apple был ни к чему.

Графический процессор был, как ни странно, практически тем же что и в A9, PowerVR Series 7XT GT7600 Plus – вот только “Plus” сообщал о каких-то его отличиях. Те же 6 ядер, которые PowerVR упорно продолжала называть кластерами, узнаваемый рисунок ядер-кластеров на ландшафте.

Это – усовершенствованный Apple вариант PowerVR Series 7XT GT7600, в 2 раза более производительный и потребляющий немного меньше энергии чем взятый за основу GPU.

В документации Apple процессор обозначался как APL1W24, в документации TSMC как 339S00255, 339S00258 и, видимо, как-то еще – он выпускался в нескольких вариантах, в начале их было 2, потом добавились и другие. Обозначения присутствуют и на крышке процессора. 339S00258, скорее всего, обозначает вариант для iPhone 7 Plus.

Кэш второго уровня (только для CPU) – 3 Мегабайта, кэш третьего уровня (для всей SoC) – 4 Мегабайта. В точности как и у Apple A9.

И iPhone 7/7+ с Apple A10 Fusion внутри действительно “рвали” конкурентов с 6- и 8-ядерными процессорами (если согласны, вступайте в наш Telegram-чат.

С тестами использующими только одно ядро все понятно: у 2-ядерного (по его сути) процессора иначе просто не могло быть

Но результаты тестов использующих все ядра которые только доступны – обратите внимание – заставляют вспомнить про магии

Продолжение следует

Главные особенности А10

  • Увеличения количества физический ядер на две штуки.
  • Сохранении старого 16-нанометрового техпроцесса производства.
  • Более крупный размер кристалла А10 по сравнению с А9.

Фото: Сравнение Apple A10 характеристик и параметров других микропроцессоров.

Отказ от перехода на 14 нанометров, скорее всего, был связан с большими объемами производства, которое было бы слишком усложнено переходом на более свежую технологию. Однако сохранение накатанной схемы производства дало возможность компании больше уделить времени на оптимизацию, причем как готовых продуктов, так и самого чипа и его архитектуры.

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий