メモ的な投稿です
|
学習やるならNVIDIA一択?いや、AMDという選択肢がありますよ
深層学習で学習やるならNVIDIA一択?いや、AMDという選択肢がありますよ - Qiita
Radeon Open ComputeとHIP言語
ImageNetでの画像認識ベンチマークのテストで過去の特徴エンジニアリングを伴う機械学習モデルのスコアを大幅に突き放しての優勝から、深層学習は機械学習・コンピュータサイエンスの分野で大きな注目を集める事となります。
同時に深層学習に用いる各種ライブラリの発展の過程においてCuda環境というGPGPU開発環境を提供してきたNVidiaはかつてのゲーム用グラフィックチップの提供メーカーにとどまらない、GPGPUコンピューティングの雄として大きく飛躍することとなりました。
一方でGPGPUの分野ではOpenCLを用いたAMDは、大きくこの分野において後れを取ることになりました。ゲーミング分野においても、DirectX12への移行が部分的にとどまったこともあり二番手にとどまっていたAMDは、GPU環境の開発において大きな奇策を打つことになりました。
「基本的にプロプリエイタリなドライバ基盤の元で動作していたグラフィックアクセラレータを、ハードウェアにごく近い低位層の規格まで解放しGPUドライバ・およびその開発アプリケーションの成熟を狙う」GPUOpenプロジェクトを発表しましたが、その一環として「GPU を用いたコンピューティングの活性化を企図し、過去のCuda 開発資産をソフトウェアの書き換えをほとんど行うことなく活用できる、オープンソースのプロジェクトを展開する」というプロジェクトの声明として「Boltzmann Initiative」を提唱しました。Boltzmann Initiativeで提示された、RadeonOpenComputeの構成は以下のようになっています。
オープンソースなGPGPUアクセラレーション基盤として、専用のグラフィックドライバを含むROCkカーネルに、Cudaコンバージョンのデバイス側への低位の中間言語への翻訳を行うHCCと、CudaコンバージョンとしてCuda開発言語 互換の処理を記述するHIP、そしてのちにはCuDNN相当のニューラルネットで用いられる畳み込み演算をはじめとした行列算のアクセラレーションを担うMIOpen、以上を統合した環境がRadeonOpenComputeです。
RadeonOpenCompute(以下ROCmと表記)の取り組みは、発表から幾度か注目を集める事となります。「Caffeのソースコードの99パーセントを書き換えることなく、100行程度のコードの修正でAMD環境でもCaffeが動作する」というSC16でのAMDの発表2はNvidia社GPUからのAMD社GPUへの移行に大いに期待を抱かせるものでありましたし、2017年11月のNVidia社のEULA改訂に伴う「ワークステーション環境におけるコンシューマ向けGPU利用制限」はNVidia社の規約に振り回されることへの危機感を覚えるユーザーに逃避先としてのAMD社GPUの利用を検討させるものとなりました。
しかし、当時のROCmは環境のインストール、および対応ライブラリ両者の未成熟もあり、関心を寄せるユーザーの期待を裏切るものとなっていました。それに伴い、ROCmへの注目も大いに後退したものと考えられます。
ROCmを取り巻く環境(2019年1月現在)
2018年11月のAMD社イベントでROCm2.0が発表されました。ROCm2.0の特徴としてROCmカーネルの起動時のオーバーヘッドの削減や、MIOpenでのニューラルネット演算向けのFuse-Matrixの追加がうたわれました。この事でROCmの実行速度がより速くなることが期待されています。
(2018年5月頃の環境)
ROCmへの注視がされなくなる一方で、ROCmは着実に発展してきました。Cudaを開発言語の多くがCuda Toolkitで開発されている現状を踏まえてか、2017年からは公式レポジトリにCu* Toolkit相当のBLAS, FFT, Eigen他のツールキットが登録され、更新が行われています。
また昨年2017年12月のROCmバージョン1.7においてDKMSを用いたカーネル管理が行われるようになり、専用のカーネルではなく公式のLinux最新カーネルに追従したまま利用ができるようになりました。
RX470で機械学習ことはじめ その3 ~ROCmとTensorFlowのインストール~ - ニートが始めるUE4開発日誌
ROCkカーネルが管理する専用グラフィックドライバKFD(Kernel fusion Driver)はLinuxカーネル4.17でLinux公式のデバイスドライバとなります。
AMD Posts Last KFD Kernel Patches For Discrete GPUs, Needed For Upstream ROCm - Phoronix
CUDAをRadeonで動かす(導入編) - Fixstars Tech Blog /proc/cpuinfo
ROCm環境下で動作する深層学習ライブラリに関しても大きな進展がありました。四月初頭に更新されたMIOpenバージョン1.3において、再帰的ニューラルネットのサポート対応を発表、LSTMやGRUといったネットワークの演算もAMDGPUの恩恵が受けられるようになりました。
ROCmで動作する深層学習ライブラリに関しても、公式のブランチから遅れること半年でTensorFlowがバージョン1.3のモデルをベースにHIPポーティングされたことを皮切りとしてHIPポーティングがなされたPyTorchがROCm公式レポジトリに追加され、
またCuPyもHIPへの対応を企図している状況にあります。
PyTorch 入門!人気急上昇中のPyTorchで知っておくべき6つの基礎知識
www.codexa.net<引用開始>
PyTorchとはPython向けのオープンソース機械学習ライブラリで、Facebookの人工知能研究グループにより初期開発されました。冒頭でも触れましたが、PyTorchは2016年後半に発表された比較的新しいライブラリです。現時点の最新の安定稼働バージョンは「0.4.1」となっており、現段階ではベータバージョンとしての位置付けとなります。
PyTorchの原型は「Torch(読み:トーチ)」と呼ばれる機械学習ライブラリです。 Googleに買収されたDeepMind社もTensorFlow以前はTorchを利用していたと言われています。Torchは「Lua言語」で書かれていましたが、Pythonのサポートを行ったのがPyTorchです。
2018年10月前半に待望の「PyTorch 1.0」の開発者向けプレビュー版がリリースされました。PyTorch 1.0のゴールはONNX(Open Neural Network Exchange)とCaffe2、さらにPyTorchの3つの良い部分を一つにまとめることにあります。
多くのエンジニアが期待しているPyTorch 1.0ですが、現在はプレビュー版です。本記事では安定稼働バージョンのPyTorch 0.4を扱います。
pytorch.org Select your preferences and run the install command. Stable represents the most currently tested and supported version of PyTorch 1.1. This should be suitable for many users. Preview is available if you want the latest, not fully tested and supported, 1.1 builds that are generated nightly. Please ensure that you have met the prerequisites below (e.g., numpy), depending on your package manager. Anaconda is our recommended package manager since it installs all dependencies. You can also install previous versions of PyTorch. Note that LibTorch is only available for C++.
Anaconda はデータサイエンス向けのPythonパッケージなどを提供するプラットフォームです。科学技術計算などを中心とした、多くのモジュールやツールのコンパイル済みバイナリファイルを提供しており、簡単にPythonを利用する環境を構築できます。
Pythonのパッケージだけではなく、他言語のライブラリやいろいろなユーティリティも提供しており、NvidiaのGPUを利用する場合に必要な、CUDAなどの環境も簡単にインストールできるようになっています。
Anacondはパッケージ管理ツールとして Conda コマンド を提供しています。 Python公式サイト の Pythonでは、パッケージは pipコマンド を使ってインストールしますが、Anacondaのパッケージは、Conda コマンドでAnacondaが管理・運用する専用のリポジトリからダウンロードし、Conda環境にインストールします。
また、標準のPythonでは、仮想環境 の管理は venv モジュールで行いますが、Anacondaでは、仮想環境も Codnaコマンドで提供しています。
<引用終了>
RX500シリーズは前世代RX400シリーズから基本的にクロックを微増したほぼリネームといって良いAMDの最新GPUです。Polaris20のフルスペック版である「Radeon RX 580」からシェーダー・演算ユニットがカットされ、クロックも少しセーブされたGPUが「Radeon RX 570」となっています。
カタログスペック上ではライバルとなるGefroce GTX 1060と比較すると、やや消費電力面で遅れを取っていますが、ビデオメモリ容量はGTX1060が3GB/6GBに比べて、RX570は4GB/8GBとアドバンテージがあります。
RX570がオススメと判断します
Radeon RX Vega 64 Air Boost 8G OC [PCIExp 8GB] MSI
¥34,460 ランキング1位 AMD
搭載チップRadeon RX Vega 64 SP数4096 メモリ(HBM2 8GB) メモリバス2048bit メモリクロック945MHz バスインターフェイスPCI Express 3.0 x16 4K対応○ 補助電源8-pin x2 モニタ端子(HDMIx1 DisplayPortx3) HDMI端子1ポート DisplayPort3ポート 幅x高さx奥行270x110x40mm 2018年 5月25日 2018年 5月25日
PUBG | R7 1700x | RX VEGA 64 | 1080p Ultra | Chicken Dinner - YouTube
GPU & CPU BENCHMARKS FOR MONERO MINING!
monerobenchmarks.infoRadeonはMonero(XMR)に向いていると言われますが
Home | Monero - secure, private, untraceable
-
Radeon RX 570 ARMOR 8G [PCIExp 8GB] MSI
¥15,778 ランキング3位 AMD
搭載チップRadeon RX 570 SP数2048 (メモリGDDR5 8GB) メモリバス256bit メモリクロック7000MHz バスインターフェイスPCI Express x16 4K対応○ 補助電源8-pin x1 モニタ端子(DVIx1 HDMIx1 DisplayPortx3)HDMI端子 DisplayPort1ポート 3ポート 幅x高さx奥行246x130x39mm 2018年12月25日
AMD Radeon RX 570 -- AMD Ryzen 5 2600 -- PUBG FPS Test Miramar Ultra - YouTube
|
「RX 570」のコスパが凄い。今なら「GTX 1050 Tiキラー」と呼べる。 | ちもろぐ
chimolog.co ものすごく今更なのは承知ですが、ここ最近2万円を割って1.8万台になるなど。異様なほど安価な「Radeon RX 570」についてレビューしました。1.8万なら、GTX 1050 Tiと2~3000円しか差が無いので、RX 570は「1050 Tiキラー」と呼べる神コスパグラボですね。
HIS RX570 4gb Ethereum mining 2019 update - YouTube
イーサリアム(英: Ethereum)とは、分散型アプリケーション (DApps) やスマート・コントラクトを構築するためのプラットフォームの名称、及び関連するオープンソース・ソフトウェア・プロジェクトの総称です。イーサリアム・プロジェクトによって開発が進められています。
イーサリアムでは、イーサリアム・ネットワークと呼ばれるP2Pのネットワーク上でスマート・コントラクトの履行履歴をブロックチェーンに記録していきます。またイーサリアムは、スマート・コントラクトを記述するチューリング完全なプログラミング言語を持ち、ネットワーク参加者はこのネットワーク上のブロックチェーンに任意のDAppsやスマート・コントラクトを記述しそれを実行することが可能になります。ネットワーク参加者が「Ether」と呼ばれるイーサリアム内部通貨の報酬を目当てに、採掘と呼ばれるブロックチェーンへのスマート・コントラクトの履行結果の記録を行うことで、その正統性を保証していきます。このような仕組みにより特定の中央管理組織に依拠せず、P2P全体を実行環境としてプログラムの実行とその結果を共有することが可能になりました。
作者 Vitalik Buterin、Gavin Wood
開発元 Gavin Wood、Jeffrey Wilcke、Vitalik Buterin等
リポジトリ github.com/ethereum
プログラミング言語 C++, Go, JavaScript, Python, Java, node.js
対応OS Linux、Windows、macOS、POSIX準拠
種別 分散コンピューティング
ライセンス GPL3、MIT、LGPL、等
公式サイト www.ethereum.org
Building Enigma / The largest Ethereum Mining Facility - YouTube
Ethereum Vs. Bitcoin: What Sets Them Apart? | CNBC - YouTube
-
SAPPHIRE RADEON RX 5700 XT 8G GDDR6 HDMI/TRIPLE DP (UEFI) [PCIExp 8GB] SAPPHIRE
¥48,428 ランキング5位 AMD
搭載チップRadeon RX 5700 XT SP数2560 メモリ(GDDR6 8GB) メモリバス256bit メモリクロック14000MHz(データレート)14Gbps(実効速度) バスインターフェイスPCI Express 4.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子(HDMIx1 DisplayPortx3) HDMI端子1ポート DisplayPort3ポート 幅x高さx奥行272x111x36mm 2019年 7月7日
-
SAPPHIRE NITRO+ RADEON RX 590 8G GDDR5 DUAL HDMI/DVI-D/DUAL DP W/BP OC (UEFI) [PCIExp 8GB] SAPPHIRE
¥24,817 ランキング11位 AMD
搭載チップRadeon RX 590 SP数2304 メモリ(GDDR5 8GB) メモリバス256bit メモリクロック8400MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子(DVIx1 HDMIx2 DisplayPortx2) HDMI端子2ポート DisplayPort2ポート 幅x高さx奥行260x43x135mm 2019年 3月8日
RTX 2060 vs RX 590 Test in 8 Games - YouTube
-
SAPPHIRE PULSE RADEON RX 580 8G GDDR5 OC V2 [PCIExp 8GB] SAPPHIRE
¥20,745 12位 AMD
搭載チップRadeon RX 580 SP数2304 メモリ(GDDR5 8GB) メモリバス256bit メモリクロック8000MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源8ピン×1 モニタ端子(DVIx1 HDMIx2 DisplayPortx2) HDMI端子2ポート DisplayPort2ポート 幅x高さx奥行230x125x40mm 2019年 3月1日
RX 580 vs GTX 1060 Test in 2019 - YouTube
www.youtube.com 1- 00:01 PUBG
2- 01:40 Deus Ex Mankind Divided
3- 03:35 Resident Evil 2 biohazard Re2 1-shot Demo
4- 05:35 Strange Brigade
5- 06:30 Assassin's Creed Odyssey
6- 07:44 Battlefield V
7- 09:22 Far Cry 5
8- 10:29 Hitman 2
9- 12:08 Shadow of the Tomb Raider
-
-
8コアCPUの価格一覧
<1>AMD FX-8320E BOX ¥12,800
Socket AM3+ 8コア 95W 3.2GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 発売日2014年 9月4日
AMD FX-8320E Eight-Core
Average CPU Mark 7550
Class: Desktop Socket: AM3+
Clockspeed: 3.2 GHz
Turbo Speed: 4.0 GHz
No of Cores: 8 (in 4 physical modules)
Typical TDP: 95 W
Other names: AMD FX-8320E Eight-Core Processor
CPU First Seen on Charts: Q4 2014
CPUmark/$Price: 76.34 Overall Rank: 566
Last Price Change: $98.9 USD (2019-08-07)
Single Thread Rating: 1366
Samples: 1207*
*Margin for error: Low
<2>FX-8350 BOX AMD ¥13,800 1
FX-8350 Socket AM3+ 8コア 125W クロック周波数4GHz 最大動作クロック周波数4.2GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 発売日 2012年10月25日
TPDが高い(100W以上)
<3>FX-8320 BOX AMD ¥16,410
FX-8320 Socket AM3+ 8コア 125W クロック周波数3.5GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 発売日2012年10月25日
TPDが高い(100W以上)
<4>Xeon E5-2609 v4 BOX インテル ¥17,359
Xeon E5-2609 v4 BOX ¥17,359 Xeon E5-2609V4(Broadwell-EP) LGA2011-3 8コア 85W 1.7GHz スレッド数 8 三次キャッシュ20MB 発売日2016年 4月11日
インテル® Xeon® プロセッサー E5-2609 v4 (20M キャッシュ、1.70 GHz) 製品仕様
ark.intel.com コアの数 8
スレッド数 8
プロセッサー・ベース動作周波数 1.70 GHz
キャッシュ 20 MB SmartCache
バススピード 6.4 GT/s QPI
QPI リンク数 2
TDP 85 W
VID 電圧範囲 0
対応ソケット FCLGA2011-3 最大 CPU 構成 2
<対応マザーボード1>EPC612D4I ASRock
EPC612D4I ¥38,691 INTEL
C612 Mini ITX LGA2011-3 S.O.DIMM DDR4 4 1本 SATA6.0G 4本 ○ 10/100/1000 ○ - Aspeed AST2400 2016年11月21日
サーバー用CPUなのに、S.O.DIMMが使えるMini ITXとは珍しい
ー
<対応マザーボード2>Z10PA-U8 ASUS
Z10PA-U8 ¥44,590 INTEL
C612 ATX LGA2011-3 DIMM DDR4 8 512GB 1本 2本 3本 SATA6.0G 9本 ○ 10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
<対応マザーボード3>X10DRL-i SUPERMICRO
X10DRL-i ¥44,602 INTEL
C612 ATX LGA2011-3 2 DIMM DDR4 8 1本 5本 SATA6.0G 10本 5 ○ 10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
<対応マザーボード4>C7X99-OCE SUPERMICRO
C7X99-OCE ¥44,603 INTEL
X99 ATX LGA2011-3 DIMM DDR4 8 64GB 4本 2本 SATA6.0G 10本 ○ ○ 10/100/1000 ○ RealTek ALC1150 - 2015年 4月8日
<対応マザーボード5>X10SRL-F SUPERMICRO
X10SRL-F ¥46,100 4店舗 - 0.00
INTEL
C612 ATX LGA2011-3 DIMM DDR4 8 2本 5本 SATA6.0G 10本 ○ 10/100/1000 ○ - Aspeed AST2400 2014年 9月11日
サーバー用だけあって、mini-ITX対応が一種類のみ。
|
<5>Ryzen 7 1700X BOX AMD ¥19,062
Ryzen 7 1700X 第1世代 Socket AM4 8コア 95W 3.4GHz 最大動作クロック周波数3.8GHz スレッド数 16 ○ 三次キャッシュ16MB 二次キャッシュ4MB 発売日2017年 2月23日
AMD Ryzen™ 7 1700Xプロセッサー | AMD
i5 9400F vs Ryzen 7 1700 Test in 8 Games - YouTube
www.youtube.com(ある程度スコアが出ているようです)
参考:Core i5 9400F BOX
プロセッサ名 Core i5 9400F(Coffee Lake-S Refresh) 世代 第9世代ソケット形状 LGA1151 コア数 6 コアTDP 65 W クロック周波数 2.9GHz最大動作クロック周波数 4.1 GHz スレッド数 6マルチスレッド 非対応 三次キャッシュ 9 MB
値
AMD Ryzen 7 1700X
Average CPU Mark 14680
Class: Desktop Socket: AM4
Clockspeed: 3.4 GHz
Turbo Speed: 3.8 GHz
No of Cores: 8 (2 logical cores per physical)
Typical TDP: 95 W
Other names: AMD Ryzen 7 1700X Eight-Core Processor
CPU First Seen on Charts: Q1 2017
CPUmark/$Price: 89.52 Overall Rank: 158
Last Price Change: $163.99 USD (2019-07-23)
14680
Single Thread Rating: 1881
Samples: 1831*
*Margin for error: Low
値
Intel Core i5-9400F @ 2.90GHz
Average CPU Mark 12135
Socket: FCLGA1151
Clockspeed: 2.9 GHz
Turbo Speed: 4.1 GHz
No of Cores: 6
Typical TDP: 65 W
Other names: Intel(R) Core(TM) i5-9400F CPU @ 2.90GHz
CPU First Seen on Charts: Q1 2019
CPUmark/$Price: 80.91 Overall Rank: 236
Last Price Change: $149.99 USD (2019-08-04)
12135
Single Thread Rating: 2394
Samples: 392*
*Margin for error: Low
-
<6>Ryzen 7 1800X BOX AMD ¥22,000
Ryzen 7 1800X 第1世代 Socket AM4 8コア 95W クロック周波数3.6GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB 発売日2017年 2月23日
<7>Ryzen 7 2700 BOX AMD ¥23,731 23位 (15票) 202件 Ryzen 7 2700 第2世代 Socket AM4 8コア 65W クロック周波数3.2GHz 最大動作クロック周波数4.1GHz 16 ○ 16MB 4MB 発売日2018年 4月17日
TPDが低くて良い(65W)
値
AMD Ryzen 7 2700
Average CPU Mark 15000
Class: Desktop Socket: AM4
Clockspeed: 3.2 GHz
Turbo Speed: 4.1 GHz
No of Cores: 8 (2 logical cores per physical)
Typical TDP: 65 W
Other names: AMD Ryzen 7 2700 Eight-Core Processor
CPU First Seen on Charts: Q2 2018
CPUmark/$Price: 77.74 Overall Rank: 151
Last Price Change: $192.96 USD (2019-08-07)
15000
Single Thread Rating: 1991
Samples: 828*
*Margin for error: Low
<8>Ryzen 7 1700 BOX AMD Ryzen 7 1700 BOX ¥24,800
Ryzen 7 1700 第1世代 Socket AM4 8コア 65W クロック周波数3GHz 最大動作クロック周波数3.7GHz 16 ○ 16MB 4MB 発売日2017年 2月23日
TPDが低くて良い(65W)
<9>Ryzen 7 2700X BOX AMD ¥26,784 10位 (51票) 1019件 Ryzen 7 2700X 第2世代 Socket AM4 8コア 105W クロック周波数3.7GHz 最大動作クロック周波数4.3GHz 16 ○ 16MB 4MB 発売日2018年 4月17日
TPDが高い(100W以上)
<10>Ryzen Threadripper 1900X BOX ¥31,450
Ryzen Threadripper 1900X 第1世代 Socket TR4 8コア 180W クロック周波数3.8GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB 発売日2017年 9月1日
TPDが高い(100W以上)
-
16スレッドある、Ryzen 7 1700Xがお得かと。
|
↑C言語の基礎的な知識が必要
|
↑
Intelの技術者が著者
並行コンピューティングの原則が理解できます
-
socket AM4/ mini ITXのマザーボード
Mini-ITX(ミニ・アイティーエックス)は、台湾のVIA Technologies社が開発したマザーボードのフォームファクタ(規格)。MicroATXやFlexATXといった小型ATX規格よりも顕著に小さく、わずか17センチメートル四方である。さらに小さなNano-ITX(ナノ・アイティーエックス、大きさ12cm四方)や、Pico-ITX(ピコ・アイティーエックス、10cm×7.2cm)がある。
<1>A320M-ITX ASRock A320M-ITX ¥9,999 45位 (4票) 0件 AMD チップセットA320 Mini ITX CPUソケットSocketAM4 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB PCI-Express 16X(1本) SATA6.0G SATA(4本) VRMフェーズ数(8) USB Type-C○ USB3.1 Type-A/USB3.1 Type-C ○ 無線LAN(無し) オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 - 2018年 5月11日
ASRock > A320M-ITX ←Asrockさんwindowsサーバー使っているんですね
www.asrock.com ・AMD AM4 ソケット Ryzen シリーズ CPU に対応 (Summit Ridge, Raven Ridge および Pinnacle Ridge)
・DDR4 3466+ (OC) (Ryzen CPU)
・1 PCIe 3.0 x16
・グラフィックス出力オプション: 2 HDMI
・7.1 チャンネル HD オーディオ (Realtek ALC1220 オーディオコーデック)
・ニチコン製ファインゴールドシリーズオーディオコンデンサ
・4 SATA3, 1 ウルトラ M.2 (PCIe Gen3 x4)
・6 USB 3.1 Gen1 (1 Type-C, 前面に 2 個、背面に 3 個)
・Intel® ギガビット LAN
Realtek ALC1220
自作PCで地味に悩む「マザーボード」の選び方を詳しく解説 | ちもろぐ
ハイエンド:
ALC 1220 サンプリングレート(入力 / 出力)(192 kHz/192 kHz) SN比(入力 / 出力)(108dB/121dB)オーディオチャンネル( 7.1 +2)
ミドルクラス:
ALC 887 サンプリングレート(入力 / 出力)(192 kHz/192 kHz) SN比(入力 / 出力)(90dB/97dB) オーディオチャンネル(7.1)
ASRock
112 台北市北投区中央南路二段37号2階
2F., No.37, Sec. 2, Jhongyang S. Rd., Beitou District,
Taipei City 112, Taiwan (R.O.C.)
<2>B350I PRO AC MSI B350I PRO AC ¥12,950 194位 (2票) 0件 AMD チップセットB350 Mini ITX CPUソケットSocketAM4 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB PCI-Express 16X(1本 ) SATA6.0G SATA(4本) DisplayPort数(1) USB Type-C無 USB3.1 Type-A ○ IEEE802.11a/b/g/n/ac USB3.0○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC887 -2018年 3月26日
B350I PRO AC | Motherboard - The world leader in motherboard design | エムエスアイコンピュータージャパン
jp.msi.com ・Supports AMD® Ryzen™ 1st and 2nd Generation/ Ryzen™ with Radeon™ Vega Graphics Processors and AMD® A-series / Athlon™ Processors for Socket AM4
・DDR4-3200+(OC)メモリ対応
・DDR4 Boost: MSI OCラボの高度な技術で可能になった、オーバークロック性能に対する最大の互換性を保証
・Turbo M.2: 最大32Gb/sの高速伝送
・Audio Boost: 最高のゲーム体験を可能にする、高品質のオーディオプロセッサを備え分離されたオーディオ
・PCI-E Steel Armor: 曲げや電磁干渉からグラフィックスカードを保護
・EZ Debug LED: トラブルシューティングへの最短の近道
・VR READY: 遅延知らずでモーション酔いを低減する最高のバーチャルリアリティゲーム体験
・X-Boost: お持ちのUSBとストレージの性能を大幅に向上させるツール
・Click BIOS 5: 高精細スケーラブルフォント、お気に入り機能、検索機能を備えた定評あるBIOS
MSI:台北微星服務中心
No. 11-1號, Songjiang Road, Zhongshan District, Taipei City, 台湾 104
<3>B450I GAMING PLUS AC MSI B450I GAMING PLUS AC ¥14,254 31位 (9票) 29件 AMD チップセットB450 Mini ITX CPUソケットSocketAM4 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB PCI-Express 16X(1本) SATA6.0G SATA(4本) VRMフェーズ数(9) DisplayPort数(1) USB Type-C無 USB3.1 Type-A USB3.0○ 無線LAN( IEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC887 - 2018年 7月31日
<4>Fatal1ty B450 Gaming-ITX/ac ASRock Fatal1ty B450 Gaming-ITX/ac ¥14,594 20位 (8票) 32件 AMD B450 Mini ITX CPUソケットSocketAM4 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB PCI-Express 16X(1本) SATA6.0G SATA(4本) VRMフェーズ数( 8) DisplayPort数(1) USB Type-C○ USB3.1 Type-A/USB3.1 Type-C USB3.0○ LED制御機能(Polychrome SYNC) 無線LAN(IEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 - 2018年 7月31日
www.asrock.com ASRock Polychrome RGBは、すべてのユーザーが、パーソナライズされた優れた照明効果を実現できるように設計されています。マザーボード上でカラー、エリア、照明効果、パターンを調整できるだけではなく、ASRock Polychrome SYNC機能を使って、メモリ、ケース、ファン、クーラー、他のコンポーネントを同期させ、素晴らしいカラフルな照明効果を作りだすことができます。
<5>Fatal1ty AB350 Gaming-ITX/ac ASRock Fatal1ty AB350 Gaming-ITX/ac ¥14,626 46位 5.00 (2票) 103件 AMD チップセットB350 Mini ITX CPUソケットSocketAM4 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB PCI-Express 16X(1本) SATA6.0G SATA(4本) VRMフェーズ数( 8) USB Type-C○ USB3.0○ 無線LAN(IEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 - 2017年 6月30日
<参考1>チップセットの違い
チップセット | X370 | B350 | A320 | X300 | A300 |
---|---|---|---|---|---|
ロゴ | |||||
ターゲット | 性能重視 | コスパ重視 | 低価格向け | 小型PC向け | |
オーバークロック | 可能 | 可能 | 不可 | 可能 | 不可 |
PCIe構成(GPU) | x16接続 x1 | x16接続 x1 | |||
x8接続 x2 | – | x8接続 x2 | – | ||
マルチGPU技術 | SLI | CrossFire | – | SLI | – |
CrossFire | – | CrossFire | – | ||
SATA | 6本 | 4本 | 2本 | ||
NVMe 2本 | |||||
SATA Express | 2本 | 1本 | 0本 | ||
PCI Express | x8 Gen2 | x6 Gen2 | x4 Gen2 | x4 Gen3 | x4 Gen3 |
※ x4 NVMeがない場合、x2 Gen3を追加 | |||||
SATA RAID構成 | RAID 0 | RAID 0 | |||
RAID 1 | RAID 1 | ||||
RAID 10 | – | ||||
USB 3.1 Gen2 | 2 | 1 | 0 | ||
USB 3.1 Gen1 | 10 | 6 | 4 | ||
USB 2.0 | 6 | 0 |
X300とA300は小型・薄型パソコン向けのチップセットで一般向けにはほとんど流通していない
AMD 400 シリーズチップセットの組み合わせでのみ有効となります。
X470 | B450 | X370 | B350 | A320 | ||
---|---|---|---|---|---|---|
CPUソケット | Socket AM4 | |||||
メモリ | 最大スロット数 | 4(チップセットの最大限であり、実装はM/Bによる) | ||||
最大容量 | 64GB(チップセットの最大限であり、実装はM/Bによる) | |||||
PCI-Express | Gen | 2.0 | 2.0 | 2.0 | 2.0 | 2.0 |
レーン数 | 8 | 6 | 8 | 6 | 4 | |
マルチGPU | SLI | ○ | × | ○ | × | × |
CrossFireX | ○ | ○ | ○ | ○ | × | |
USB | 3.1 | 2 | 2 | 2 | 2 | 1 |
3.0 | 6 | 2 | 6 | 2 | 2 | |
2.0 | 6 | 6 | 6 | 6 | 6 | |
SATA | 6.0Gb/s | 4 | 2 | 4 | 2 | 2 |
Express | 2 | 1 | 2 | 1 | 1 | |
RAID | SATA | 〇(0/1/10) | 〇(0/1/10) | 〇(0/1/10) | 〇(0/1/10) | 〇(0/1/10) |
NVMe | 〇(0/1/10) | 〇(0/1/10) | 〇(0/1/10) | 〇(0/1/10) | × | |
AMD StoreMI | ○ | ○ | × | × | × | |
OverClocking | ○ | ○ | ○ | ○ | × | |
XFR2 | ○ | ○ | ○ | ○ | ○ | |
XFR2 Enhanced | ○ | ○ | × | × | × | |
Precision Boost Overdrive | ○ | ○ | × | × | × |
オーバークロックする予定にないならAC320でいいと思います
<参考2>
マルチGPUは
CrossFire(クロスファイア)およびCrossFireX(クロスファイア エックス)は、ATI Technologies(現AMD)が開発したマルチGPU技術。CrossFire/CrossFireX対応グラフィックスカード(ビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ)を、同一のマザーボード上に複数枚挿入し、それらを電気的に接続する。複数個のGPUによる並列処理により、処理能力の大幅な向上が期待できる。AMD製チップセットを搭載したマザーボードに限らず、インテル製チップセットを搭載したマザーボードでも構築できる点が大きな特徴といえる
↑
B450とB350が対応 A320は非対応
Scalable Link Interface (SLI、スケーラブル・リンク・インターフェース) とは、NVIDIAのマルチGPU動作システムである。2枚あるいはそれ以上のSLI対応グラフィックスカード(ビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ)を並列動作させ、出力は1つに集約させることで、コンピュータグラフィックスの描画処理を高速に行なうことができる。派生した規格としてHybrid SLIがある
<参考3>
無線LAN は
必要になったら1000-2000円程度で、/ac対応の無線LANアダプタが買えます
<参考4>
最大メモリ容量
動画編集には16GBあれば十分かなと
ちなみに64GBまで使えるMB(マザーボード)になると、3万5000円くらい値段になります
<参考5>
フォームファクタはMini-ITXで選びました
メモリ:DIMM DDR4
(DIMM DDR4 メモリ)
相場 8GB DDR4 2400MHz PC4-19200 (Single Rank 8GB)
で、4000円~4500円くらいですね
2枚16GBで8000円~9000円ほど
参考:
トランセンド・インフォメーション(Transcend Information, Inc.、TWSE: 2451)は、台湾台北市に本拠地を置き半導体メモリ製品を中心に製造を行う企業である。1988年8月に Peter Shu(束崇萬)によって設立された。アメリカ合衆国、ドイツ、オランダ、イギリス、日本、香港、中華人民共和国、インド、韓国に支社を持つ。
日本法人はトランセンドジャパン株式会社(Transcend Japan、1996年12月設立)で、本社は東京都台東区蔵前1-8-5 トランセンドビル
Transcend のメモリを使うと1枚5480円位かかります。
5480円×2=1万0960円
|
【メモリ屋社長のちょっとタメになるメモリ話】Ryzenで話題になった、メモリの”Rank”って何のこと? - PC Watch
<引用開始>
メモリのRankとは?
さて、第1回はやはりメモリのお話をしようと思うのですが、社内でも今話題になっているのは、先日登場したAMDのRyzenです。コストパフォーマンスがよく、対応メモリも2666(2667)までとIntelを追い抜き、久しぶりにAMDの反撃を予感させてくれる製品です。
ところが、どうもメモリ周りの仕様が少々ややこしく、搭載枚数だけでなく、搭載するメモリのRankによっても速度が変わってくるようです。2DIMMの場合、シングルRankだと2,667MHzで動きますが、デュアルRankだと2,400MHz止まり、4DIMMだとそれぞれ2,133MHz、1,866MHzとなります。Rankというのはメモリの動作単位なのですが、今回はこのRankについて解説したいと思います。
自作PCで使われるメモリはDIMM(Dual Inline Memory Module) と呼ばれるモジュールタイプのメモリですが、DIMMは基本的に64bitのバス幅を持っており、CPU、あるいはチップセットのメモリコントローラと64bit単位でデータのやりとりを行ないます。DIMMには複数のDRAMチップが搭載されており、必ずこの64bitの単位を構成できるようになっています。
そして、1枚のDIMMに64bitになるDRAMのグループが1つであれば1Rank、2つであれば2Rankとなります。メモリコントローラはRank毎にやりとりを行なうので、2Rankメモリでは電気的には2枚のメモリが刺さっていることになり、メモリコントローラによっては速度が下がる、搭載できる枚数が減るなど、制約が発生する場合があります。
それでは、Rankの判別はどうするかですが、基本的にはスペック表記で判断して頂くことになります。時々「DRAMが片面に実装されていたら1Rank、両面に実装されていたら2Rank」という判別方法を聞きますが、間違いです。確かにそれでも結果的には合っている場合が多いのですが、両面実装で1Rankのメモリも存在します。
また、直接Rankの記載がなくとも、DRAMチップに記載されている型番などからDRAMの仕様がわかれば、Rankの計算をすることはできるのですが、それにはDRAMの構成を理解する必要があります。
DRAMには、例えば同じ4Gbでも、1024Mb x4や512Mb x8など、内部の構成に違いがあります。内部の構造を簡単に表したものが上の図です。
<以上引用>
OS起動用ストレージ
M.2 SSD(OS起動用)1GBあたりの価格順
参考:M.2 SSDのサイズ規格
type2280(22×80)
type2260(22×60)
type2242(22×42)
<1>インテル(1GBあたりの価格¥11)
SSD 660p SSDPEKNW020T8X1 ¥22,980 24位
(1票) 4件 2048GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間 1GBあたりの価格 ¥11 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大):220000 IOPS ランダム書き込み(8GB スパン) (最大):220000 IOPS 発売日2018年 9月21日
|
<2>インテル(¥12)
540s Series SSDSCKKW480H6X1 ¥5,980 121位
(0票) 0件 480GB M.2 (Type2280) Serial ATA 6Gb/s TLC 内蔵 MTBF(平均故障間隔)160万時間 2.38mm 1GBあたりの価格¥12 読込速度(560MB/s) 書込速度(480MB/s) ランダム読込速度Random 4 KB Reads: up to 78000 IOPS Random 4 KB Writes: up to 85000 IOPS 発売日2016年 4月14日
<3>crucial(¥12)
MX500 CT1000MX500SSD4/JP ¥12,380 68位
(3票) 0件 1000GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵 1GBあたりの価格 ¥12 読込速度(560MB/s) 書込速度(510MB/s) ランダム読込速度Random Read:95K IOPS Random Write:90K IOPS 発売日2018年 4月28日
<4>インテル(¥12)
SSD 660p SSDPEKNW010T8X1 ¥12,203 20位
(2票) 16件 1024GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間 1GBあたりの価格¥12 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大):150000 IOPS ランダム書き込み(8GB スパン) (最大):220000 IOPS 発売日2018年 9月21日
<5>旭東エレクトロニクス( ¥12)
SUNEAST SE800-n512GB ¥6,174 135位
(1票) 0件 512GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵 MTBF(平均故障間隔)200万時間 3.5mm 1GBあたりの価格¥12 読込速度(530MB/s) 書込速度(500MB/s) 発売日2017年11月20日
参考:〒530-0047 大阪府大阪市北区西天満5丁目9−3 旭東エレクトロニクス
M.2 と Hyper M.2 や Ultra M.2 の違い
direct.pc-physics.com以下は、両者の対応インターフェース規格です。
M.2 | Serial ATA 6.0 Gbps PCI Express 2.0 x4 |
---|---|
Hyper M.2 Ultra M.2 |
Serial ATA 6.0 Gbps PCI Express 3.0 x4 |
両者を比べると、対応している PCI Express のリビジョンに違いがあります。M.2 は PCI Express 2.0 に対応しており、Hyper M.2 や Ultra M.2 は PCI Express 3.0 に対応しています。つまり、Hyper M.2 や Ultra M.2 の方が、データ転送速度が速いです。
M.2
M.2 (Type2242)
2242は基板の外形寸法(幅x長さ) 22mm x 42mmを意味します。
M.2 SSDの規格で一番小さな大きさとなります。
type2280(22×80)
type2260(22×60)
type2242(22×42)
速度
PCI Express 2.0 x4 | 20Gbps |
---|---|
PCI Express 3.0 x4 | 40Gbps |
ちなみに、x4 は対応レーン数の上限を表しています。つまり、レーン数の上限は4ですが、x2(レーン数の上限は2)の場合もあります。レーン数が異なればデータ転送速度も異なります。
参考:NANDフラッシュ
1. SLC(シングルレベルセル)
メリット – 長所
・もっとも寿命が長い
・読み書き時、エラーが発生する確率が低い
・幅広い温度環境で動作可能
デメリット – 短所
・一般向けSSDでは最も高価なタイプ
・大容量化はあまり進んでおらず、低容量の製品が多い
2. MLC(マルチレベルセル)
メリット – 長所
・SLCと比べて、かなり低コストになった
・主流のTLCよりも堅牢性に期待できる
デメリット – 短所
・SLCほどの精度と耐久性は期待できない
3. TLC(トリプルレベルセル)
メリット – 長所
・一般人が入手できるSSDでは、最も安価なタイプ
・大容量SSDも、十分に手が届く価格になった
デメリット – 短所
・MLCよりも耐久性能は悪く、エンタープライズ市場では見向きもされない
4. QLC(クアッドレベルセル)
メリット – 長所
・おそらく、SSD史上もっとも安価な製品が登場する
デメリット – 短所
・TLCよりも悪化するであろう耐久性能
・実際に、QLC形式のNANDフラッシュを採用したSSDが登場してみないことに分かりませんが、基本的には更に安くなって、耐久度は落ちるというイメージです。
大体の予算:
低価格で組む場合
CPU:
Ryzen 7 1700X ¥19,062
|
M/B:
A320M-ITX
|
SSD(OS起動用)
【送料無料】intel(インテル) SSDPEKNW020T8X1 Intel SSD 660p Series 2TB
|
|
DDR4(DIMM)
トランセンド JM2400HLB-8G [8GB JM DDR4 2400 U-DIMM 1Rx8 (1024Mx8)]
|
続きは後日
ー
動画編集ソフトが対応するスレッド数について
<引用開始>
Adobe Premiere ProのエンコードではCPU全コア使い切れない?
CUDA 有効時のエンコードだと CPU 全コアを使い切れないのか
CPU のコア数が多くても、ソフトウェアによっては全コアを使い切れません。
エンコード処理であれば CPU の全コアを使い切るソフトウェアが多く、Adobe Premiere Pro も例外ではなさそうですが、CPU の全コアを使い切れていないという噂があったようです。
Core i9とRyzen Threadripperのレンダリング・動画エンコード速度を比較してみた | パソコン工房 NEXMAG には、以下のとおり書かれています。(この記事の最終更新日は2018年1月31日)
Adobe Premire Proでは、すべてのコアを使い切れていないという噂もあったので、真偽を確かめるべくエンコード処理中のタスクマネージャーも見てみました。
(略)
結論として、いずれの場合においても、すべてのコアを使用しきっていました。ただ、CUDAエンコード処理時においては、CPUの使用率が低減している状況が確認できました。グラフィックカードにGeForce GTX 1060を使用したのですが、グラフィックカードの性能がボトルネックになった可能性もあります。また、メモリ消費量も、CUDA使用時の方が高い状況が見られました。
GeForce GTX 1060 グラフィックスカード | GeForce
www.nvidia.com CUDA(Compute Unified Device Architecture:クーダ)とは、NVIDIAが開発・提供している、GPU向けの汎用並列コンピューティングプラットフォーム(並列コンピューティングアーキテクチャ)およびプログラミングモデルである。専用のC/C++コンパイラ (nvcc) やライブラリ (API) などが提供されている。なおNVIDIA製GPUにおいては、OpenCL/DirectComputeなどの類似APIコールは、すべて共通のGPGPUプラットフォームであるCUDAを経由することになる。
CUDAを使ったGPUプログラミング超入門 - Qiita
「異種混合環境での並列プログラミングのオープンな標準規格」、つまりGPGPUには特化していません。
規格自体はKhronosが策定しており、Intel, AMD, ARMが推しています。一応NVIDIAでも動きますが、現状、やる気のなさがヒシヒシと伝わってくるので、NVIDIA社のGPUでOpenCLを書くのは特殊な事情がないならお勧めしません。
デバイス側をOpenCL Cという独自拡張されたC言語(※OpenCL2.2からはOpenCL C++という特殊なC++14で書けるようになります)でホストとは別に書いて実行時に文字列で渡して、ホスト側でオンラインコンパイルします。ホスト側は普通のgccやclangなどのコンパイラが使えます。
長所は、標準規格であり使える環境が多い点ですが、やはりCUDAには利用者数もライブラリ群の整備状況も負けてるので、取っ付きやすさという意味ではCUDAに負けます。とは言っても、昨今のGPUは倍精度演算はNVIDIAよりAMDの方が速かったりして、倍精度が必要な物理計算等でAMDのGPUが使いたかったらOpenCL一択です。
(とは言うものの今の世界、だいたいメモリのread性能に律速するので、倍精度演算性能そのものはそれほど重要でないことも多い)。
他のCUDA採用ツールの事例
NVIDIA® CUDA
GPUプロセッシング技術により、HD動画および高品質ビデオH264AVCの動画変換のスピードがアップします。
動画入力:
AVI, MP4, FLV, MKV(H264) MPEG2 PS, MPEG2 TS(MPEG1/2)。
動画出力:
AVI, FLV, MP4(H264)
図は、MPEG2TS形式HD動画の変換スピードをNVIDIA® CUDATM対応のVGAカードVIDIA GeForce9800GT)を使用した場合と使用しなかった場合の比較です。
マルチコアCPU搭載PC、マルチスレッドに対応
AMD、Intelのマルチコア搭載PCをご利用の場合、 使用するCPU数をソフト上から自由に設定することが可能です。 たとえ、お使いのPCにVIDIA® CUDA対応のVGAカードが 搭載されていなくても、同時並行処理(マルチスレッド)により 従来製品の300%アップのスピードで、高速動画変換が可能です。
戻ります
検証に使われた CPU は、以下の CPU です。
・インテル Core i9-7980XE 18コア36スレッド
・インテル Core i9-7960X 16コア32スレッド
・インテル Core i9-7900X 10コア20スレッド
・インテル Core i7-7820X 8コア16スレッド
・インテル Core i7-7800X 6コア12スレッド
・AMD Ryzen Threadripper 1950X 16コア32スレッド
・AMD Ryzen Threadripper 1920X 12コア24スレッド
エンコード処理の主な内容は、以下のとおりです。
エンコード速度を計る為、解像度は4K(3840×2160)、60fpsの10分31秒あるH.264のmp4形式の動画を、フルHD(1920×1080)に変更し、60fpsのH.264 mp4形式で出力させたときの時間をストップウォッチで計測してみました。
Adobe Premire Pro CC にて CUDA を有効にしてエンコード処理を行った場合は、CPU の全コアを使い切れていない状況になったようです。
CUDA を無効にしても、使用環境、エンコード処理内容によっては CPU の全コアを使い切れていない状況になる可能性があるかもしれません。
Adobe Premire Pro CC にて CPU の全コアを使い切れていないという噂の詳細についてわからないと、どのような条件で発生する可能性があるのか推測は難しいです。
Ryzen Threadripper 2990WX 32コア64スレッドだと全コアを使い切れないのか
ASCII.jp:32コア64スレッドは乗りこなせるか? 第2世代「Ryzen Threadripper」を速攻で試す (4/6)|最新パーツ性能チェック には、以下のとおり書かれています。
【レビュー】23万円の最強CPU「Ryzen Threadripper 2990WX」を買ったので自慢します!www - YouTube
|
クリエイター向けのCPUパワーを食う処理といえば動画エンコードがある。そこで4K動画4つを「Premiere Pro CC 2018」を利用してタイル状に並べ、再生時間約1分の8K動画にまとめ、それを「Media Encoder CC」を利用してH.264形式の8K動画に書き出す時間を比較する。ビットレートは50Mbps、2パスVBRでエンコードを行った。
このテストではおかしなことに、32コア64スレッドの2990WXが、16コア32スレッドの1950Xより遅いというにわかに信じがたい結果が出た。そしてコア数で並ぶ2950Xと1950Xとの比較においても、アーキテクチャー的に新しい2950Xの方が負けている始末。CGレンダリングではあれだけ速いのに、動画エンコードではなぜか第2世代Threadripperは遅いのだ。
★◇AMD Ryzen Threadripper 1950X BOX 【CPU】【送料無料】
|
プロセッサ名 Ryzen Threadripper 1950X 世代 第1世代 約8万円
ソケット形状 Socket TR4 コア数 16 コア
TDP 180 W クロック周波数 3.4GHz
最大動作クロック周波数 4 GHz スレッド数 32
マルチスレッド ○ 三次キャッシュ 32 MB
二次キャッシュ 8MB
今回の8コア(16スレッドCPU)約2万円
プロセッサ名 Ryzen 7 1700X 世代 第1世代
ソケット形状 Socket AM4 コア数 8 コア
TDP 95 W クロック周波数 3.4GHz
最大動作クロック周波数 3.8 GHz スレッド数 16
マルチスレッド ○ 三次キャッシュ 16 MB
二次キャッシュ 4MB
戻ります
Ryzen Threadripper 2990WX の全コアを使い切れていないことを示す結果が得られたようです。
GPU(ビデオチップ)の性能がボトルネックとなった可能性がありますが、Ryzen Threadripper 1950X よりも遅い結果が出た等を考慮すると、その可能性はないと考えられます。
同記事によると、時間が限られていますので原因の特定はできませんでしたが、BIOS の熟成不足、評価用 CPU またはマザーボードの不具合、発熱とサーマルスロットリング、以上の原因が考えられるそうです。
他の検証でも、Adobe Premire Pro のエンコード処理において Ryzen Threadripper 2990WX の全コアを使い切れていないことが確認できたようです。
32コアの“暴れ馬”はこう乗りこなす ~【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch には、以下のとおり書かれています。(この記事の公開年月日は2018年9月29日)
32コアの“暴れ馬”はこう乗りこなす ~【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch
pc.watch.impress.co.jp メインストリームCPUが4コア、背伸びをして8コア……と言っていたのはわずか2年ほど前のこと。だが、今は32コア/64スレッドの「Ryzen Threadripper 2990WX」で超メニーコアPCが組めてしまう時代。論理64スレッドで何をするの? と問う奴は野暮の極みだ。確かにThreadripperはCPUの仕様もプラットフォームも普通のCPUと一味違う。安易に手を出せば火傷必至だが、ポイントさえ押さえれば普通の自作となんら変わりはない。どう組めばよいのか、どう乗りこなせばよいのか、パーツを手に試行錯誤しながら完成度を高めていけるのは、自作PCならではだ。前代未聞の32コアCPUの手なづけかたを解説する!
ところが、エンコード系処理では意外な結果が。Premiere Pro CC 2018で編集した再生時間1分の8K動画を、Media Encoder CC 2018でMP4形式で書き出させても、体感的にはRyzen 7 2700Xと大差ない。CPU占有率を見ると、64コアの半分も使っていないことが分かった。Threadripperのコア1/2モード(16コア32スレッド)で動かすと、Blenderは1.5倍以上の時間がかかるのにMedia Encoder CCはほとんど差が出ず、H.264とH.265では後者のほうが処理の並列度が低いことも分かった。むしろLightroom CC 2018のシャープネス処理のほうがCPUをしっかり使ってくれている。32コアの暴れ馬は、ひどく乗り手(アプリ)を選ぶのだ。
(略)
その一方で、Media Encoder CCでのエンコード処理は2990WXの1/2~1/4程度しか活用していない。とくにH.265ではほぼこんな状態で、低負荷なコア、仕事をしていないコアがいくつもある。アプリ側の改善が必要なようだ
検証に使われた CPU は、Ryzen Threadripper 2990WX 32コア64スレッド。ビデオカードは GeForce GTX 1080 Ti です。
GTX 1080 Ti グラフィックス カード - GeForce
Introducing the GeForce GTX 1080 Ti – ULTIMATE GEFORCE - YouTube
CUDA を有効にしたかどうか不明ですが、仮に CUDA を有効にしてエンコードした結果だとしても、ビデオカードの性能がボトルネックとなって CPU の使用率が低減したようには見えず、明らかに負荷がかかっていないコア、負荷がほとんどかかっていないコアが多数見られますので、Adobe Premire Pro CC は、Ryzen Threadripper 2990WX 32コア64スレッドに関しては別の原因で CPU の全コアを使い切れていないと考えられます。
<引用終了>
続きは後日
-