8コアCPUでお得なCPU+マザーボード+メモリ(DDR4)+SSDは?/ OpenCLでGPUプログラミング

メモ的な投稿です

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

OpenCL2入門 メニーコアCPU&GPGPU時代の並列処理 [ 北山洋幸 ]
価格:5832円(税込、送料無料) (2019/8/7時点)

楽天で購入

 


学習やるならNVIDIA一択?いや、AMDという選択肢がありますよ
 

深層学習で学習やるならNVIDIA一択?いや、AMDという選択肢がありますよ - Qiita

qiita.com

Radeon Open ComputeとHIP言語

 ImageNetでの画像認識ベンチマークのテストで過去の特徴エンジニアリングを伴う機械学習モデルのスコアを大幅に突き放しての優勝から、深層学習は機械学習コンピュータサイエンスの分野で大きな注目を集める事となります。
 同時に深層学習に用いる各種ライブラリの発展の過程においてCuda環境というGPGPU開発環境を提供してきたNVidiaはかつてのゲーム用グラフィックチップの提供メーカーにとどまらない、GPGPUコンピューティングの雄として大きく飛躍することとなりました

 一方でGPGPUの分野ではOpenCLを用いたAMDは、大きくこの分野において後れを取ることになりました。ゲーミング分野においても、DirectX12への移行が部分的にとどまったこともあり二番手にとどまっていたAMDは、GPU環境の開発において大きな奇策を打つことになりました
 「基本的にプロプリエイタリなドライバ基盤の元で動作していたグラフィックアクセラレータを、ハードウェアにごく近い低位層の規格まで解放しGPUドライバ・およびその開発アプリケーションの成熟を狙う」GPUOpenプロジェクトを発表しましたが、その一環として「GPU を用いたコンピューティングの活性化を企図し、過去のCuda 開発資産をソフトウェアの書き換えをほとんど行うことなく活用できる、オープンソースのプロジェクトを展開する」というプロジェクトの声明として「Boltzmann Initiative」を提唱しました。Boltzmann Initiativeで提示された、RadeonOpenComputeの構成は以下のようになっています

RadeonOpenCompute

 オープンソースGPGPUアクセラレーション基盤として、専用のグラフィックドライバを含むROCkカーネルに、Cudaコンバージョンのデバイス側への低位の中間言語への翻訳を行うHCCと、CudaコンバージョンとしてCuda開発言語 互換の処理を記述するHIP、そしてのちにはCuDNN相当のニューラルネットで用いられる畳み込み演算をはじめとした行列算のアクセラレーションを担うMIOpen、以上を統合した環境がRadeonOpenComputeです。

 RadeonOpenCompute(以下ROCmと表記)の取り組みは、発表から幾度か注目を集める事となります。「Caffeのソースコードの99パーセントを書き換えることなく、100行程度のコードの修正でAMD環境でもCaffeが動作する」というSC16でのAMDの発表2はNvidiaGPUからのAMDGPUへの移行に大いに期待を抱かせるものでありましたし、2017年11月のNVidia社のEULA改訂に伴う「ワークステーション環境におけるコンシューマ向けGPU利用制限」はNVidia社の規約に振り回されることへの危機感を覚えるユーザーに逃避先としてのAMDGPUの利用を検討させるものとなりました。
しかし、当時のROCmは環境のインストール、および対応ライブラリ両者の未成熟もあり、関心を寄せるユーザーの期待を裏切るものとなっていました。それに伴い、ROCmへの注目も大いに後退したものと考えられます

 ROCmを取り巻く環境(2019年1月現在)

 2018年11月のAMDイベントでROCm2.0が発表されました。ROCm2.0の特徴としてROCmカーネルの起動時のオーバーヘッドの削減や、MIOpenでのニューラルネット演算向けのFuse-Matrixの追加がうたわれました。この事でROCmの実行速度がより速くなることが期待されています

 (2018年5月頃の環境)

 ROCmへの注視がされなくなる一方で、ROCmは着実に発展してきました。Cudaを開発言語の多くがCuda Toolkitで開発されている現状を踏まえてか、2017年からは公式レポジトリにCu* Toolkit相当のBLAS, FFT, Eigen他のツールキットが登録され、更新が行われています

EigenでFFTする - wildpieの日記

wildpie.hatenablog.com


 また昨年2017年12月のROCmバージョン1.7においてDKMSを用いたカーネル管理が行われるようになり、専用のカーネルではなく公式のLinux最新カーネルに追従したまま利用ができるようになりました

RX470で機械学習ことはじめ その3 ~ROCmとTensorFlowのインストール~ - ニートが始めるUE4開発日誌

noroue4.hatenablog.com


 ROCkカーネルが管理する専用グラフィックドライバKFD(Kernel fusion Driver)Linuxカーネル4.17でLinux公式のデバイスドライバとなります

AMD Posts Last KFD Kernel Patches For Discrete GPUs, Needed For Upstream ROCm - Phoronix

www.phoronix.com

CUDAをRadeonで動かす(導入編) - Fixstars Tech Blog /proc/cpuinfo

proc-cpuinfo.fixstars.com


 ROCm環境下で動作する深層学習ライブラリに関しても大きな進展がありました。四月初頭に更新されたMIOpenバージョン1.3において、再帰ニューラルネットのサポート対応を発表、LSTMやGRUといったネットワークの演算もAMDGPUの恩恵が受けられるようになりました

MIOpen - GPUOpen

gpuopen.com


 ROCmで動作する深層学習ライブラリに関しても、公式のブランチから遅れること半年でTensorFlowがバージョン1.3のモデルをベースにHIPポーティングされたことを皮切りとしてHIPポーティングがなされたPyTorchがROCm公式レポジトリに追加され、
またCuPyもHIPへの対応を企図している状況にあります

PyTorch 入門!人気急上昇中のPyTorchで知っておくべき6つの基礎知識

www.codexa.net<引用開始>

 PyTorchとはPython向けのオープンソース機械学習ライブラリで、Facebook人工知能研究グループにより初期開発されました。冒頭でも触れましたが、PyTorchは2016年後半に発表された比較的新しいライブラリです。現時点の最新の安定稼働バージョンは「0.4.1」となっており、現段階ではベータバージョンとしての位置付けとなります

 PyTorchの原型は「Torch(読み:トーチ)」と呼ばれる機械学習ライブラリです。 Googleに買収されたDeepMind社もTensorFlow以前はTorchを利用していたと言われています。Torchは「Lua言語」で書かれていましたが、Pythonのサポートを行ったのがPyTorchです

 2018年10月前半に待望の「PyTorch 1.0」の開発者向けプレビュー版がリリースされました。PyTorch 1.0のゴールはONNX(Open Neural Network Exchange)とCaffe2、さらにPyTorchの3つの良い部分を一つにまとめることにあります

 多くのエンジニアが期待しているPyTorch 1.0ですが、現在はプレビュー版です。本記事では安定稼働バージョンのPyTorch 0.4を扱います

PyTorch

pytorch.org Select your preferences and run the install command. Stable represents the most currently tested and supported version of PyTorch 1.1. This should be suitable for many users. Preview is available if you want the latest, not fully tested and supported, 1.1 builds that are generated nightly. Please ensure that you have met the prerequisites below (e.g., numpy), depending on your package manager. Anaconda is our recommended package manager since it installs all dependencies. You can also install previous versions of PyTorch. Note that LibTorch is only available for C++.

Anaconda - python.jp

www.python.jp

 Anaconda はデータサイエンス向けのPythonパッケージなどを提供するプラットフォームです。科学技術計算などを中心とした、多くのモジュールやツールのコンパイル済みバイナリファイルを提供しており、簡単にPythonを利用する環境を構築できます

 Pythonのパッケージだけではなく、他言語のライブラリやいろいろなユーティリティも提供しており、NvidiaGPUを利用する場合に必要な、CUDAなどの環境も簡単にインストールできるようになっています

 Anacondはパッケージ管理ツールとして Conda コマンド を提供しています。 Python公式サイト の Pythonでは、パッケージは pipコマンド を使ってインストールしますが、Anacondaのパッケージは、Conda コマンドでAnacondaが管理・運用する専用のリポジトリからダウンロードし、Conda環境にインストールします

 また、標準のPythonでは、仮想環境 の管理は venv モジュールで行いますが、Anacondaでは、仮想環境も Codnaコマンドで提供しています

<引用終了>

 RX500シリーズは前世代RX400シリーズから基本的にクロックを微増したほぼリネームといって良いAMDの最新GPUです。Polaris20のフルスペック版である「Radeon RX 580」からシェーダー・演算ユニットがカットされ、クロックも少しセーブされたGPUが「Radeon RX 570」となっています。

 カタログスペック上ではライバルとなるGefroce GTX 1060と比較すると、やや消費電力面で遅れを取っていますが、ビデオメモリ容量はGTX1060が3GB/6GBに比べて、RX570は4GB/8GBとアドバンテージがあります。

RX570がオススメと判断します

  Radeon RX Vega 64 Air Boost 8G OC [PCIExp 8GB] MSI

  ¥34,460   ランキング1位 AMD
  搭載チップRadeon RX Vega 64   SP数4096 メモリ(HBM2  8GB) メモリバス2048bit メモリクロック945MHz バスインターフェイスPCI Express 3.0 x16 4K対応○ 補助電源8-pin x2 モニタ端子(HDMIx1 DisplayPortx3) HDMI端子1ポート DisplayPort3ポート 幅x高さx奥行270x110x40mm 2018年 5月25日 2018年 5月25日

PUBG | R7 1700x | RX VEGA 64 | 1080p Ultra | Chicken Dinner - YouTube

www.youtube.com

GPU & CPU BENCHMARKS FOR MONERO MINING!

monerobenchmarks.infoRadeonはMonero(XMR)に向いていると言われますが

Home | Monero - secure, private, untraceable

web.getmonero.org

-

  Radeon RX 570 ARMOR 8G [PCIExp 8GB] MSI
  ¥15,778   ランキング3位   AMD
  搭載チップRadeon RX 570   SP数2048 (メモリGDDR5 8GB) メモリバス256bit メモリクロック7000MHz バスインターフェイスPCI Express x16 4K対応○ 補助電源8-pin x1 モニタ端子(DVIx1 HDMIx1 DisplayPortx3)HDMI端子 DisplayPort1ポート 3ポート 幅x高さx奥行246x130x39mm 2018年12月25日

AMD Radeon RX 570 -- AMD Ryzen 5 2600 -- PUBG FPS Test Miramar Ultra - YouTube

www.youtube.com


 

「RX 570」のコスパが凄い。今なら「GTX 1050 Tiキラー」と呼べる。 | ちもろぐ

chimolog.co  ものすごく今更なのは承知ですが、ここ最近2万円を割って1.8万台になるなど。異様なほど安価な「Radeon RX 570」についてレビューしました。1.8万なら、GTX 1050 Tiと2~3000円しか差が無いので、RX 570は「1050 Tiキラー」と呼べる神コスパグラボですね

HIS RX570 4gb Ethereum mining 2019 update - YouTube

www.youtube.com

 イーサリアム(英: Ethereum)とは、分散型アプリケーション (DApps) やスマート・コントラクトを構築するためのプラットフォームの名称、及び関連するオープンソース・ソフトウェア・プロジェクトの総称です。イーサリアム・プロジェクトによって開発が進められています。

 イーサリアムでは、イーサリアム・ネットワークと呼ばれるP2Pのネットワーク上でスマート・コントラクトの履行履歴をブロックチェーンに記録していきます。またイーサリアムは、スマート・コントラクトを記述するチューリング完全プログラミング言語を持ち、ネットワーク参加者はこのネットワーク上のブロックチェーンに任意のDAppsやスマート・コントラクトを記述しそれを実行することが可能になります。ネットワーク参加者が「Ether」と呼ばれるイーサリアム内部通貨の報酬を目当てに、採掘と呼ばれるブロックチェーンへのスマート・コントラクトの履行結果の記録を行うことで、その正統性を保証していきます。このような仕組みにより特定の中央管理組織に依拠せず、P2P全体を実行環境としてプログラムの実行とその結果を共有することが可能になりました。

 作者 Vitalik Buterin、Gavin Wood
 開発元 Gavin Wood、Jeffrey Wilcke、Vitalik Buterin等
 リポジトリ github.com/ethereum
 プログラミング言語 C++, Go, JavaScript, Python, Java, node.js
 対応OS LinuxWindowsmacOSPOSIX準拠
 種別 分散コンピューティング
 ライセンス GPL3、MIT、LGPL、等
 公式サイト www.ethereum.org

Home | Ethereum

ethereum.org

Building Enigma / The largest Ethereum Mining Facility - YouTube

www.youtube.com

Ethereum Vs. Bitcoin: What Sets Them Apart? | CNBC - YouTube

www.youtube.com


-

  SAPPHIRE RADEON RX 5700 XT 8G GDDR6 HDMI/TRIPLE DP (UEFI) [PCIExp 8GB] SAPPHIRE 

  ¥48,428   ランキング5位   AMD
  搭載チップRadeon RX 5700 XT   SP数2560 メモリ(GDDR6 8GB) メモリバス256bit メモリクロック14000MHz(データレート)14Gbps(実効速度) バスインターフェイスPCI Express 4.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子(HDMIx1 DisplayPortx3) HDMI端子1ポート DisplayPort3ポート 幅x高さx奥行272x111x36mm 2019年 7月7日

RX 5700 XT Apex Legends - PUBG - Fortnite | 1080p & 1440p Maxed & Competitive | FRAME-RATE TEST - YouTube

www.youtube.com


-

  SAPPHIRE NITRO+ RADEON RX 590 8G GDDR5 DUAL HDMI/DVI-D/DUAL DP W/BP OC (UEFI) [PCIExp 8GB] SAPPHIRE
  ¥24,817 ランキング11位   AMD
  搭載チップRadeon RX 590   SP数2304 メモリ(GDDR5 8GB) メモリバス256bit メモリクロック8400MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子(DVIx1 HDMIx2 DisplayPortx2) HDMI端子2ポート DisplayPort2ポート 幅x高さx奥行260x43x135mm 2019年 3月8日

RTX 2060 vs RX 590 Test in 8 Games - YouTube

www.youtube.com


-

  SAPPHIRE PULSE RADEON RX 580 8G GDDR5 OC V2 [PCIExp 8GB] SAPPHIRE
  ¥20,745 12位   AMD
  搭載チップRadeon RX 580   SP数2304 メモリ(GDDR5 8GB) メモリバス256bit メモリクロック8000MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源8ピン×1 モニタ端子(DVIx1 HDMIx2 DisplayPortx2) HDMI端子2ポート DisplayPort2ポート 幅x高さx奥行230x125x40mm 2019年 3月1日

RX 580 vs GTX 1060 Test in 2019 - YouTube

www.youtube.com 1- 00:01 PUBG
 2- 01:40 Deus Ex Mankind Divided
 3- 03:35 Resident Evil 2 biohazard Re2 1-shot Demo
 4- 05:35 Strange Brigade
 5- 06:30 Assassin's Creed Odyssey
 6- 07:44 Battlefield V
 7- 09:22 Far Cry 5
 8- 10:29 Hitman 2
 9- 12:08 Shadow of the Tomb Raider

-

-


8コアCPUの価格一覧

<1>AMD FX-8320E BOX ¥12,800 

    Socket AM3+ 8コア 95W 3.2GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB   発売日2014年 9月4日

FX-8320E | AMD

www.amd.com

AMD FX-8320E Eight-Core
 Average CPU Mark 7550
 Class: Desktop Socket: AM3+
 Clockspeed: 3.2 GHz
 Turbo Speed: 4.0 GHz
 No of Cores: 8 (in 4 physical modules)
 Typical TDP: 95 W

 Other names: AMD FX-8320E Eight-Core Processor
 CPU First Seen on Charts: Q4 2014
 CPUmark/$Price: 76.34 Overall Rank: 566
 Last Price Change: $98.9 USD (2019-08-07) 
 Single Thread Rating: 1366
 Samples: 1207*
 *Margin for error: Low


<2>FX-8350 BOX AMD  ¥13,800 1

FX-8350   Socket AM3+ 8コア 125W クロック周波数4GHz 最大動作クロック周波数4.2GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB  発売日 2012年10月25日

FX-8320E | AMD

www.amd.com

TPDが高い(100W以上)

 

 

<3>FX-8320 BOX AMD  ¥16,410 

FX-8320   Socket AM3+ 8コア 125W クロック周波数3.5GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB   発売日2012年10月25日

TPDが高い(100W以上)

 

 


<4>Xeon E5-2609 v4 BOX インテル  ¥17,359

Xeon E5-2609 v4 BOX ¥17,359   Xeon E5-2609V4(Broadwell-EP)   LGA2011-3 8コア 85W 1.7GHz   スレッド数 8 三次キャッシュ20MB     発売日2016年 4月11日

インテル® Xeon® プロセッサー E5-2609 v4 (20M キャッシュ、1.70 GHz) 製品仕様

ark.intel.com コアの数 8
 スレッド数 8
 プロセッサー・ベース動作周波数 1.70 GHz
 キャッシュ 20 MB SmartCache
 バススピード 6.4 GT/s QPI
 QPI リンク数 2
 TDP 85 W 
 VID 電圧範囲 0

  対応ソケット FCLGA2011-3 最大 CPU 構成 2 

<対応マザーボード1>EPC612D4I ASRock
 EPC612D4I ¥38,691  INTEL
 C612 Mini ITX LGA2011-3   S.O.DIMM DDR4 4     1本       SATA6.0G 4本             ○     10/100/1000 ○ - Aspeed AST2400 2016年11月21日
 サーバー用CPUなのに、S.O.DIMMが使えるMini ITXとは珍しい


<対応マザーボード2>Z10PA-U8 ASUS
 Z10PA-U8 ¥44,590  INTEL
 C612 ATX LGA2011-3   DIMM DDR4 8 512GB 1本 2本 3本     SATA6.0G 9本             ○     10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
<対応マザーボード3>X10DRL-i SUPERMICRO
 X10DRL-i ¥44,602  INTEL
 C612 ATX LGA2011-3 2 DIMM DDR4 8     1本 5本     SATA6.0G 10本     5       ○     10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
<対応マザーボード4>C7X99-OCE SUPERMICRO
 C7X99-OCE ¥44,603   INTEL
 X99 ATX LGA2011-3   DIMM DDR4 8 64GB   4本   2本   SATA6.0G 10本       ○       ○     10/100/1000 ○ RealTek ALC1150 - 2015年 4月8日
<対応マザーボード5>X10SRL-F SUPERMICRO
 X10SRL-F ¥46,100 4店舗 - 0.00
  INTEL
 C612 ATX LGA2011-3   DIMM DDR4 8     2本 5本     SATA6.0G 10本             ○     10/100/1000 ○ - Aspeed AST2400 2014年 9月11日

サーバー用だけあって、mini-ITX対応が一種類のみ。



 


<5>Ryzen 7 1700X BOX AMD ¥19,062 
Ryzen 7 1700X 第1世代 Socket AM4 8コア 95W 3.4GHz 最大動作クロック周波数3.8GHz スレッド数 16 ○ 三次キャッシュ16MB 二次キャッシュ4MB   発売日2017年 2月23日

AMD Ryzen™ 7 1700Xプロセッサー | AMD

www.amd.com

i5 9400F vs Ryzen 7 1700 Test in 8 Games - YouTube

www.youtube.com(ある程度スコアが出ているようです)
参考:Core i5 9400F BOX
 プロセッサ名 Core i5 9400F(Coffee Lake-S Refresh) 世代 第9世代ソケット形状 LGA1151 コア数 6 コアTDP 65 W クロック周波数 2.9GHz最大動作クロック周波数 4.1 GHz スレッド数 6マルチスレッド 非対応  三次キャッシュ 9 MB


 AMD Ryzen 7 1700X
 Average CPU Mark 14680
 Class: Desktop Socket: AM4
 Clockspeed: 3.4 GHz
 Turbo Speed: 3.8 GHz
 No of Cores: 8 (2 logical cores per physical)
 Typical TDP: 95 W

 Other names: AMD Ryzen 7 1700X Eight-Core Processor
 CPU First Seen on Charts: Q1 2017
 CPUmark/$Price: 89.52 Overall Rank: 158
 Last Price Change: $163.99 USD (2019-07-23)
14680

 Single Thread Rating: 1881
 Samples: 1831*
 *Margin for error: Low


 Intel Core i5-9400F @ 2.90GHz
 Average CPU Mark 12135
 Socket: FCLGA1151
 Clockspeed: 2.9 GHz 
 Turbo Speed: 4.1 GHz
 No of Cores: 6
 Typical TDP: 65 W

 Other names: Intel(R) Core(TM) i5-9400F CPU @ 2.90GHz
 CPU First Seen on Charts: Q1 2019
 CPUmark/$Price: 80.91 Overall Rank: 236
 Last Price Change: $149.99 USD (2019-08-04)
12135

 Single Thread Rating: 2394
 Samples: 392*
 *Margin for error: Low




-

<6>Ryzen 7 1800X BOX AMD ¥22,000

Ryzen 7 1800X 第1世代 Socket AM4 8コア 95W クロック周波数3.6GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB   発売日2017年 2月23日


<7>Ryzen 7 2700 BOX AMD ¥23,731  23位 (15票) 202件 Ryzen 7 2700 第2世代 Socket AM4 8コア 65W クロック周波数3.2GHz 最大動作クロック周波数4.1GHz 16 ○ 16MB 4MB   発売日2018年 4月17日

TPDが低くて良い(65W)

 

 AMD Ryzen 7 2700
 Average CPU Mark 15000
 Class: Desktop Socket: AM4
 Clockspeed: 3.2 GHz
 Turbo Speed: 4.1 GHz
 No of Cores: 8 (2 logical cores per physical)
 Typical TDP: 65 W

 Other names: AMD Ryzen 7 2700 Eight-Core Processor
 CPU First Seen on Charts: Q2 2018
 CPUmark/$Price: 77.74 Overall Rank: 151
 Last Price Change: $192.96 USD (2019-08-07)
 15000

 Single Thread Rating: 1991
 Samples: 828*
 *Margin for error: Low

 

<8>Ryzen 7 1700 BOX AMD Ryzen 7 1700 BOX ¥24,800 

Ryzen 7 1700 第1世代 Socket AM4 8コア 65W クロック周波数3GHz 最大動作クロック周波数3.7GHz 16 ○ 16MB 4MB   発売日2017年 2月23日

TPDが低くて良い(65W)


<9>Ryzen 7 2700X BOX AMD  ¥26,784  10位 (51票) 1019件 Ryzen 7 2700X 第2世代 Socket AM4 8コア 105W クロック周波数3.7GHz 最大動作クロック周波数4.3GHz 16 ○ 16MB 4MB   発売日2018年 4月17日

TPDが高い(100W以上)


<10>Ryzen Threadripper 1900X BOX  ¥31,450 

  Ryzen Threadripper 1900X 第1世代 Socket TR4 8コア 180W クロック周波数3.8GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB  発売日2017年 9月1日
TPDが高い(100W以上)

-

16スレッドある、Ryzen 7 1700Xがお得かと。


 

C言語の基礎的な知識が必要


 


Intelの技術者が著者
並行コンピューティングの原則が理解できます

-
socket AM4/ mini ITXマザーボード

 Mini-ITX(ミニ・アイティーエックス)は、台湾のVIA Technologies社が開発したマザーボードフォームファクタ(規格)。MicroATXやFlexATXといった小型ATX規格よりも顕著に小さく、わずか17センチメートル四方である。さらに小さなNano-ITX(ナノ・アイティーエックス、大きさ12cm四方)や、Pico-ITX(ピコ・アイティーエックス、10cm×7.2cm)がある。

<1>A320M-ITX ASRock A320M-ITX ¥9,999  45位 (4票) 0件 AMD チップセットA320 Mini ITX CPUソケットSocketAM4   DIMM DDR4 メモリスロット数2 最大メモリー容量32GB   PCI-Express 16X(1本)       SATA6.0G SATA(4本)     VRMフェーズ数(8)     USB Type-C○ USB3.1 Type-A/USB3.1 Type-C ○   無線LAN(無し)  オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 -  2018年 5月11日

ASRock > A320M-ITX ←Asrockさんwindowsサーバー使っているんですね

www.asrock.comAMD AM4 ソケット Ryzen シリーズ CPU に対応 (Summit Ridge, Raven Ridge および Pinnacle Ridge)
・DDR4 3466+ (OC) (Ryzen CPU)
・1 PCIe 3.0 x16
・グラフィックス出力オプション: 2 HDMI
・7.1 チャンネル HD オーディオ (Realtek ALC1220 オーディオコーデック)
ニチコン製ファインゴールドシリーズオーディオコンデンサ
・4 SATA3, 1 ウルトラ M.2 (PCIe Gen3 x4)
・6 USB 3.1 Gen1 (1 Type-C, 前面に 2 個、背面に 3 個)
Intel® ギガビット LAN

Realtek ALC1220

自作PCで地味に悩む「マザーボード」の選び方を詳しく解説 | ちもろぐ

ハイエンド:
ALC 1220 サンプリングレート(入力 / 出力)(192 kHz/192 kHz) SN比(入力 / 出力)(108dB/121dB)オーディオチャンネル( 7.1 +2)
ミドルクラス:
ALC 887 サンプリングレート(入力 / 出力)(192 kHz/192 kHz) SN比(入力 / 出力)(90dB/97dB) オーディオチャンネル(7.1)
ASRock
112 台北市北投区中央南路二段37号2階
2F., No.37, Sec. 2, Jhongyang S. Rd., Beitou District,
Taipei City 112, Taiwan (R.O.C.)

 

<2>B350I PRO AC MSI B350I PRO AC ¥12,950  194位  (2票) 0件 AMD チップセットB350 Mini ITX CPUソケットSocketAM4   DIMM DDR4 メモリスロット数2 最大メモリー容量32GB   PCI-Express 16X(1本 )      SATA6.0G SATA(4本)       DisplayPort数(1)  USB Type-C無 USB3.1 Type-A ○   IEEE802.11a/b/g/n/ac USB3.0オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC887 -2018年 3月26日

B350I PRO AC | Motherboard - The world leader in motherboard design | エムエスアイコンピュータージャパン

jp.msi.com ・Supports AMD® Ryzen™ 1st and 2nd Generation/ Ryzen™ with Radeon™ Vega Graphics Processors and AMD® A-series / Athlon™ Processors for Socket AM4
・DDR4-3200+(OC)メモリ対応
・DDR4 Boost: MSI OCラボの高度な技術で可能になった、オーバークロック性能に対する最大の互換性を保証
・Turbo M.2: 最大32Gb/sの高速伝送
・Audio Boost: 最高のゲーム体験を可能にする、高品質のオーディオプロセッサを備え分離されたオーディオ
PCI-E Steel Armor: 曲げや電磁干渉からグラフィックスカードを保護
・EZ Debug LED: トラブルシューティングへの最短の近道
VR READY: 遅延知らずでモーション酔いを低減する最高のバーチャルリアリティゲーム体験
・X-Boost: お持ちのUSBとストレージの性能を大幅に向上させるツール
・Click BIOS 5: 高精細スケーラブルフォント、お気に入り機能、検索機能を備えた定評あるBIOS

MSI台北微星服務中心
 No. 11-1號, Songjiang Road, Zhongshan District, Taipei City, 台湾 104

<3>B450I GAMING PLUS AC MSI B450I GAMING PLUS AC ¥14,254  31位  (9票) 29件 AMD チップセットB450 Mini ITX CPUソケットSocketAM4   DIMM DDR4 メモリスロット数2 最大メモリー容量32GB  PCI-Express 16X(1本)       SATA6.0G SATA(4本)     VRMフェーズ数(9) DisplayPort数(1)  USB Type-C無  USB3.1 Type-A USB3.0○  無線LANIEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC887 - 2018年 7月31日

 

<4>Fatal1ty B450 Gaming-ITX/ac ASRock Fatal1ty B450 Gaming-ITX/ac ¥14,594  20位  (8票) 32件 AMD B450 Mini ITX CPUソケットSocketAM4   DIMM DDR4 メモリスロット数2 最大メモリー容量32GB  PCI-Express 16X(1本)       SATA6.0G SATA(4本)    VRMフェーズ数( 8) DisplayPort数(1)   USB Type-C○ USB3.1 Type-A/USB3.1 Type-C USB3.0○ LED制御機能(Polychrome SYNC無線LANIEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 - 2018年 7月31日

ASRock RGB Sync

www.asrock.com ASRock Polychrome RGBは、すべてのユーザーが、パーソナライズされた優れた照明効果を実現できるように設計されています。マザーボード上でカラー、エリア、照明効果、パターンを調整できるだけではなく、ASRock Polychrome SYNC機能を使って、メモリ、ケース、ファン、クーラー、他のコンポーネントを同期させ、素晴らしいカラフルな照明効果を作りだすことができます。


<5>Fatal1ty AB350 Gaming-ITX/ac ASRock Fatal1ty AB350 Gaming-ITX/ac ¥14,626  46位 5.00 (2票) 103件 AMD チップセットB350 Mini ITX CPUソケットSocketAM4   DIMM DDR4 メモリスロット数2 最大メモリー容量32GB   PCI-Express 16X(1本)       SATA6.0G SATA(4本)    VRMフェーズ数( 8)     USB Type-C○   USB3.0○   無線LANIEEE802.11a/b/g/n/ac) ○ オンボードLAN10/100/1000 オンボードRAID○ オーディオRealtek ALC1220 - 2017年 6月30日

<参考1>チップセットの違い

Socket AM4 Platform | AMD

www.amd.com

チップセット X370 B350 A320 X300 A300
ロゴ
ターゲット 性能重視 コスパ重視 低価格向け 小型PC向け
オーバークロック 可能 可能 不可 可能 不可
PCIe構成(GPU x16接続 x1 x16接続 x1
x8接続 x2 x8接続 x2
マルチGPU技術 SLI CrossFire SLI
CrossFire CrossFire
SATA 6本 4本 2本
NVMe 2本
SATA Express 2本 1本 0本
PCI Express x8 Gen2 x6 Gen2 x4 Gen2 x4 Gen3 x4 Gen3
※ x4 NVMeがない場合、x2 Gen3を追加
SATA RAID構成 RAID 0 RAID 0
RAID 1 RAID 1
RAID 10
USB 3.1 Gen2 2 1 0
USB 3.1 Gen1 10 6 4
USB 2.0 6 0

 X300とA300は小型・薄型パソコン向けのチップセットで一般向けにはほとんど流通していない

 
B450なども含めた表

AMD 400 シリーズチップセットの組み合わせでのみ有効となります。

  X470 B450 X370 B350 A320
CPUソケット Socket AM4
メモリ 最大スロット数 4(チップセットの最大限であり、実装はM/Bによる)
最大容量 64GB(チップセットの最大限であり、実装はM/Bによる)
PCI-Express Gen 2.0 2.0 2.0 2.0 2.0
レーン数 8 6 8 6 4
マルチGPU SLI × × ×
CrossFireX ×
USB 3.1 2 2 2 2 1
3.0 6 2 6 2 2
2.0 6 6 6 6 6
SATA 6.0Gb/s 4 2 4 2 2
Express 2 1 2 1 1
RAID SATA 〇(0/1/10) 〇(0/1/10) 〇(0/1/10) 〇(0/1/10) 〇(0/1/10)
NVMe 〇(0/1/10) 〇(0/1/10) 〇(0/1/10) 〇(0/1/10) ×
AMD StoreMI × × ×
OverClocking ×
XFR2
XFR2 Enhanced × × ×
Precision Boost Overdrive × × ×

B450/X470 AMD 400 シリーズチップセット スペック比較表

 

オーバークロックする予定にないならAC320でいいと思います

<参考2>
マルチGPU
 CrossFireクロスファイア)およびCrossFireXクロスファイア エックス)は、ATI Technologies(現AMD)が開発したマルチGPU技術。CrossFire/CrossFireX対応グラフィックスカード(ビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ)を、同一のマザーボード上に複数枚挿入し、それらを電気的に接続する。複数個のGPUによる並列処理により、処理能力の大幅な向上が期待できる。AMDチップセットを搭載したマザーボードに限らず、インテルチップセットを搭載したマザーボードでも構築できる点が大きな特徴といえる
 ↑
 B450B350が対応 A320は非対応

 Scalable Link Interface (SLI、スケーラブル・リンク・インターフェース) とは、NVIDIAのマルチGPU動作システムである。2枚あるいはそれ以上のSLI対応グラフィックスカードビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ)を並列動作させ、出力は1つに集約させることで、コンピュータグラフィックスの描画処理を高速に行なうことができる。派生した規格としてHybrid SLIがある

<参考3>
無線LAN は
 必要になったら1000-2000円程度で、/ac対応の無線LANアダプタが買えます

<参考4>
最大メモリ容量

 動画編集には16GBあれば十分かなと
 ちなみに64GBまで使えるMB(マザーボード)になると、3万5000円くらい値段になります

<参考5>
 フォームファクタMini-ITXで選びました

メモリ:DIMM DDR4 

 (DIMM DDR4 メモリ)

 相場 8GB DDR4 2400MHz PC4-19200  (Single Rank 8GB) 
で、4000円~4500円くらいですね
2枚16GBで8000円~9000円ほど

参考:

 トランセンド・インフォメーション(Transcend Information, Inc.、TWSE: 2451)は、台湾台北市に本拠地を置き半導体メモリ製品を中心に製造を行う企業である。1988年8月に Peter Shu(束崇萬)によって設立された。アメリカ合衆国、ドイツ、オランダ、イギリス、日本、香港、中華人民共和国、インド、韓国に支社を持つ。

 日本法人はトランセンドジャパン株式会社(Transcend Japan、1996年12月設立)で、本社は東京都台東区蔵前1-8-5 トランセンドビル


Transcend のメモリを使うと1枚5480円位かかります。
 5480円×2=1万0960円

 

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

Transcend 増設メモリ 8GB DDR4-2666 PC4-21300 U-DIMM TS1GLH64V6B
価格:5480円(税込、送料無料) (2019/8/7時点)

楽天で購入

 

【メモリ屋社長のちょっとタメになるメモリ話】Ryzenで話題になった、メモリの”Rank”って何のこと? - PC Watch

pc.watch.impress.co.jp

 

<引用開始>
メモリのRank
とは?

 さて、第1回はやはりメモリのお話をしようと思うのですが、社内でも今話題になっているのは、先日登場したAMDRyzenです。コストパフォーマンスがよく、対応メモリも2666(2667)までとIntelを追い抜き、久しぶりにAMDの反撃を予感させてくれる製品です。

 ところが、どうもメモリ周りの仕様が少々ややこしく、搭載枚数だけでなく、搭載するメモリのRankによっても速度が変わってくるようです。2DIMMの場合、シングルRankだと2,667MHzで動きますが、デュアルRankだと2,400MHz止まり、4DIMMだとそれぞれ2,133MHz、1,866MHzとなります。Rankというのはメモリの動作単位なのですが、今回はこのRankについて解説したいと思います。

 自作PCで使われるメモリはDIMM(Dual Inline Memory Module) と呼ばれるモジュールタイプのメモリですが、DIMMは基本的に64bitのバス幅を持っており、CPU、あるいはチップセットのメモリコントローラと64bit単位でデータのやりとりを行ないます。DIMMには複数のDRAMチップが搭載されており、必ずこの64bitの単位を構成できるようになっています。

 そして、1枚のDIMMに64bitになるDRAMのグループが1つであれば1Rank、2つであれば2Rankとなります。メモリコントローラはRank毎にやりとりを行なうので、2Rankメモリでは電気的には2枚のメモリが刺さっていることになり、メモリコントローラによっては速度が下がる、搭載できる枚数が減るなど、制約が発生する場合があります。

 それでは、Rankの判別はどうするかですが、基本的にはスペック表記で判断して頂くことになります。時々DRAMが片面に実装されていたら1Rank、両面に実装されていたら2Rank」という判別方法を聞きますが、間違いです。確かにそれでも結果的には合っている場合が多いのですが、両面実装で1Rankのメモリも存在します。

 また、直接Rankの記載がなくとも、DRAMチップに記載されている型番などからDRAMの仕様がわかれば、Rankの計算をすることはできるのですが、それにはDRAMの構成を理解する必要があります。

DDR4

  DRAMには、例えば同じ4Gbでも、1024Mb x4や512Mb x8など、内部の構成に違いがあります。内部の構造を簡単に表したものが上の図です。
<以上引用>

  

OS起動用ストレージ

 M.2  SSD(OS起動用)1GBあたりの価格順
 
参考:M.2  SSDのサイズ規格

 type2280(22×80)
 type2260(22×60)
 type2242(22×42)

<1>インテル(1GBあたりの価格¥11)
SSD 660p SSDPEKNW020T8X1 ¥22,980  24位
(1票) 4件 2048GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間  1GBあたりの価格 ¥11 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大):220000 IOPS ランダム書き込み(8GB スパン) (最大):220000 IOPS 発売日2018年 9月21日


 

<2>インテル(¥12)
540s Series SSDSCKKW480H6X1 ¥5,980  121位
(0票) 0件 480GB M.2 (Type2280) Serial ATA 6Gb/s TLC 内蔵 MTBF(平均故障間隔)160万時間 2.38mm 1GBあたりの価格¥12 読込速度(560MB/s) 書込速度(480MB/s) ランダム読込速度Random 4 KB Reads: up to 78000 IOPS Random 4 KB Writes: up to 85000 IOPS 発売日2016年 4月14日 
<3>crucial(¥12)
MX500 CT1000MX500SSD4/JP ¥12,380  68位
(3票) 0件 1000GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵    1GBあたりの価格 ¥12 読込速度(560MB/s) 書込速度(510MB/s) ランダム読込速度Random Read:95K IOPS Random Write:90K IOPS 発売日2018年 4月28日
<4>インテル(¥12)
SSD 660p SSDPEKNW010T8X1 ¥12,203 20位
(2票) 16件 1024GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間   1GBあたりの価格¥12 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大):150000 IOPS ランダム書き込み(8GB スパン) (最大):220000 IOPS 発売日2018年 9月21日
<5>旭東エレクトロニクス( ¥12)
SUNEAST SE800-n512GB ¥6,174 135位
(1票) 0件 512GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵 MTBF(平均故障間隔)200万時間 3.5mm 1GBあたりの価格¥12 読込速度(530MB/s) 書込速度(500MB/s)     発売日2017年11月20日

参考:〒530-0047 大阪府大阪市北区西天満5丁目9−3 旭東エレクトロニクス

 

 

M.2 と Hyper M.2 や Ultra M.2 の違い

direct.pc-physics.com以下は、両者の対応インターフェース規格です。

M.2 Serial ATA 6.0 Gbps
PCI Express 2.0 x4
Hyper M.2
Ultra M.2
Serial ATA 6.0 Gbps
PCI Express 3.0 x4


 両者を比べると、対応している PCI Express のリビジョンに違いがあります。M.2 は PCI Express 2.0 に対応しており、Hyper M.2 や Ultra M.2 は PCI Express 3.0 に対応しています。つまり、Hyper M.2 や Ultra M.2 の方が、データ転送速度が速いです。

 

M.2
 M.2 (Type2242)
 2242は基板の外形寸法(幅x長さ) 22mm x 42mmを意味します。
 M.2 SSDの規格で一番小さな大きさとなります。

  type2280(22×80)
 type2260(22×60)
 type2242(22×42)

 速度

PCI Express 2.0 x4 20Gbps
PCI Express 3.0 x4 40Gbps


ちなみに、x4 は対応レーン数の上限を表しています。つまり、レーン数の上限は4ですが、x2(レーン数の上限は2)の場合もあります。レーン数が異なればデータ転送速度も異なります。

 

 参考:NANDフラッシュ

1. SLC(シングルレベルセル)
メリット – 長所
 ・もっとも寿命が長い
 ・読み書き時、エラーが発生する確率が低い
 ・幅広い温度環境で動作可能
デメリット – 短所
 ・一般向けSSDでは最も高価なタイプ
 ・大容量化はあまり進んでおらず、低容量の製品が多い

2. MLC(マルチレベルセル)
 メリット – 長所
 ・SLCと比べて、かなり低コストになった
 ・主流のTLCよりも堅牢性に期待できる
 デメリット – 短所
 ・SLCほどの精度と耐久性は期待できない

3. TLC(トリプルレベルセル)
 メリット – 長所
 ・一般人が入手できるSSDでは、最も安価なタイプ
 ・大容量SSDも、十分に手が届く価格になった
 デメリット – 短所
 ・MLCよりも耐久性能は悪く、エンタープライズ市場では見向きもされない

4. QLC(クアッドレベルセル)
 メリット – 長所
 ・おそらく、SSD史上もっとも安価な製品が登場する
 デメリット – 短所
 ・TLCよりも悪化するであろう耐久性能
 ・実際に、QLC形式のNANDフラッシュを採用したSSDが登場してみないことに分かりませんが、基本的には更に安くなって、耐久度は落ちるというイメージです。

大体の予算
 低価格で組む場合

CPU:
 Ryzen 7 1700X ¥19,062 

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

【送料無料】AMD CPU Ryzen7 1700X AM4 YD170XBCAEWOF
価格:23746円(税込、送料無料) (2019/8/7時点)

楽天で購入

 

 
M/B:
 A320M-ITX 

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

ASRock AMD A320チップセット搭載 Mini-ITXマザーボード A320M-ITX[cb]
価格:11878円(税込、送料別) (2019/8/7時点)

楽天で購入

 

 

 SSD(OS起動用)
【送料無料】intelインテル) SSDPEKNW020T8X1 Intel SSD 660p Series 2TB

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

【送料無料】intel(インテル) SSDPEKNW020T8X1 Intel SSD 660p Series 2TB
価格:24998円(税込、送料無料) (2019/8/7時点)

楽天で購入

 


 

 

DDR4(DIMM)

トランセンド JM2400HLB-8G [8GB JM DDR4 2400 U-DIMM 1Rx8 (1024Mx8)]

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

トランセンド JM2400HLB-8G [8GB JM DDR4 2400 U-DIMM 1Rx8 (1024Mx8)]
価格:5280円(税込、送料無料) (2019/8/7時点)

楽天で購入

 

 
続きは後日


動画編集ソフトが対応するスレッド数について

<引用開始>
 Adobe Premiere ProのエンコードではCPU全コア使い切れない?

 CUDA 有効時のエンコードだと CPU 全コアを使い切れないのか 
 CPU のコア数が多くても、ソフトウェアによっては全コアを使い切れません。

 エンコード処理であれば CPU の全コアを使い切るソフトウェアが多く、Adobe Premiere Pro も例外ではなさそうですが、CPU の全コアを使い切れていないという噂があったようです。

 Core i9Ryzen Threadripperのレンダリング・動画エンコード速度を比較してみた | パソコン工房 NEXMAG には、以下のとおり書かれています。(この記事の最終更新日は2018年1月31日)

 Adobe Premire Proでは、すべてのコアを使い切れていないという噂もあったので、真偽を確かめるべくエンコード処理中のタスクマネージャーも見てみました。

 (略)

 結論として、いずれの場合においても、すべてのコアを使用しきっていました。ただ、CUDAエンコード処理時においては、CPUの使用率が低減している状況が確認できました。グラフィックカードGeForce GTX 1060を使用したのですが、グラフィックカードの性能がボトルネックになった可能性もあります。また、メモリ消費量も、CUDA使用時の方が高い状況が見られました。
 GeForce GTX 1060 グラフィックスカード | GeForce

 

www.nvidia.com CUDA(Compute Unified Device Architecture:クーダ)とは、NVIDIAが開発・提供している、GPU向けの汎用並列コンピューティングプラットフォーム(並列コンピューティングアーキテクチャ)およびプログラミングモデルである。専用のC/C++コンパイラ (nvcc) やライブラリ (API) などが提供されている。なおNVIDIAGPUにおいては、OpenCL/DirectComputeなどの類似APIコールは、すべて共通のGPGPUプラットフォームであるCUDAを経由することになる
 CUDAを使ったGPUプログラミング超入門 - Qiita

 

qiita.com

CUDAとOpenCLどっちがいいの? - Qiita

qiita.com

「異種混合環境での並列プログラミングのオープンな標準規格」、つまりGPGPUには特化していません

 規格自体はKhronosが策定しており、Intel, AMD, ARMが推しています。一応NVIDIAでも動きますが、現状、やる気のなさがヒシヒシと伝わってくるので、NVIDIA社のGPUOpenCLを書くのは特殊な事情がないならお勧めしません

 バイス側をOpenCL Cという独自拡張されたC言語(※OpenCL2.2からはOpenCL C++という特殊なC++14で書けるようになります)でホストとは別に書いて実行時に文字列で渡して、ホスト側でオンラインコンパイルします。ホスト側は普通のgccやclangなどのコンパイラが使えます

 長所は、標準規格であり使える環境が多い点ですが、やはりCUDAには利用者数もライブラリ群の整備状況も負けてるので、取っ付きやすさという意味ではCUDAに負けます。とは言っても、昨今のGPUは倍精度演算はNVIDIAよりAMDの方が速かったりして、倍精度が必要な物理計算等でAMDGPUが使いたかったらOpenCL一択です
(とは言うものの今の世界、だいたいメモリのread性能に律速するので、倍精度演算性能そのものはそれほど重要でないことも多い)


 他のCUDA採用ツールの事例

劇的に加速、GPUプロセッシング

www.wondershare.jp

NVIDIA® CUDA
 GPUプロセッシング技術により、HD動画および高品質ビデオH264AVCの動画変換のスピードがアップします。

動画入力:
 AVI, MP4, FLV, MKV(H264) MPEG2 PS, MPEG2 TS(MPEG1/2)。

動画出力:
 AVI, FLV, MP4(H264)

 

 図は、MPEG2TS形式HD動画の変換スピードをNVIDIA® CUDATM対応のVGAカードVIDIA GeForce9800GT)を使用した場合と使用しなかった場合の比較です

CUDA フィモーラ



 マルチコアCPU搭載PC、マルチスレッドに対応 
 AMDIntelマルチコア搭載PCをご利用の場合、 使用するCPU数をソフト上から自由に設定することが可能です。 たとえ、お使いのPCにVIDIA® CUDA対応のVGAカードが 搭載されていなくても、同時並行処理(マルチスレッド)により 従来製品の300%アップのスピードで、高速動画変換が可能です



戻ります

検証に使われた CPU は、以下の CPU です。

 ・インテル Core i9-7980XE 18コア36スレッド
 ・インテル Core i9-7960X 16コア32スレッド
 ・インテル Core i9-7900X 10コア20スレッド
 ・インテル Core i7-7820X 8コア16スレッド
 ・インテル Core i7-7800X 6コア12スレッド
 ・AMD Ryzen Threadripper 1950X 16コア32スレッド
 ・AMD Ryzen Threadripper 1920X 12コア24スレッド

 エンコード処理の主な内容は、以下のとおりです。

 エンコード速度を計る為、解像度は4K(3840×2160)、60fpsの10分31秒あるH.264のmp4形式の動画を、フルHD(1920×1080)に変更し、60fpsH.264 mp4形式で出力させたときの時間をストップウォッチで計測してみました。

 Adobe Premire Pro CC にて CUDA を有効にしてエンコード処理を行った場合は、CPU の全コアを使い切れていない状況になったようです。

 CUDA を無効にしても、使用環境、エンコード処理内容によっては CPU の全コアを使い切れていない状況になる可能性があるかもしれません。

 Adobe Premire Pro CC にて CPU の全コアを使い切れていないという噂の詳細についてわからないと、どのような条件で発生する可能性があるのか推測は難しいです。
 Ryzen Threadripper 2990WX 32コア64スレッドだと全コアを使い切れないのか
ASCII.jp:32コア64スレッドは乗りこなせるか? 第2世代「Ryzen Threadripper」を速攻で試す (4/6)|最新パーツ性能チェック には、以下のとおり書かれています。
 

【レビュー】23万円の最強CPU「Ryzen Threadripper 2990WX」を買ったので自慢します!www - YouTube

www.youtube.com

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

YD299XAZAFWOF AMD AMD CPU 2990WX(Ryzen Threadripper)
価格:219800円(税込、送料無料) (2019/8/7時点)

楽天で購入

 




 クリエイター向けのCPUパワーを食う処理といえば動画エンコードがある。そこで4K動画4つを「Premiere Pro CC 2018」を利用してタイル状に並べ、再生時間約1分の8K動画にまとめ、それを「Media Encoder CC」を利用してH.264形式の8K動画に書き出す時間を比較する。ビットレートは50Mbps、2パスVBRエンコードを行った。

 このテストではおかしなことに、32コア64スレッドの2990WXが、16コア32スレッドの1950Xより遅いというにわかに信じがたい結果が出た。そしてコア数で並ぶ2950Xと1950Xとの比較においても、アーキテクチャー的に新しい2950Xの方が負けている始末。CGレンダリングではあれだけ速いのに、動画エンコードではなぜか第2世代Threadripperは遅いのだ。

★◇AMD Ryzen Threadripper 1950X BOX 【CPU】【送料無料】

 

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

★◇AMD Ryzen Threadripper 1950X BOX 【CPU】【送料無料】
価格:81250円(税込、送料無料) (2019/8/7時点)

楽天で購入

 

 
プロセッサ名 Ryzen Threadripper 1950X 世代 第1世代 約万円
 ソケット形状 Socket TR4 コア数 16 コア 
 TDP 180 W クロック周波数 3.4GHz
 最大動作クロック周波数 4 GHz スレッド数 32 
 マルチスレッド ○ 三次キャッシュ 32 MB
 二次キャッシュ 8MB

今回の8コア(16スレッドCPU)約万円
 プロセッサ名 Ryzen 7 1700X 世代 第1世代
 ソケット形状 Socket AM4 コア数 8 コア 
 TDP 95 W クロック周波数 3.4GHz
 最大動作クロック周波数 3.8 GHz スレッド数 16 
 マルチスレッド ○ 三次キャッシュ 16 MB
 二次キャッシュ 4MB

戻ります
 Ryzen Threadripper 2990WX の全コアを使い切れていないことを示す結果が得られたようです。

 GPU(ビデオチップ)の性能がボトルネックとなった可能性がありますが、Ryzen Threadripper 1950X よりも遅い結果が出た等を考慮すると、その可能性はないと考えられます。

 同記事によると、時間が限られていますので原因の特定はできませんでしたが、BIOS の熟成不足、評価用 CPU またはマザーボードの不具合、発熱とサーマルスロットリング、以上の原因が考えられるそうです。

 他の検証でも、Adobe Premire Pro のエンコード処理において Ryzen Threadripper 2990WX の全コアを使い切れていないことが確認できたようです。

 

「Don't Buy AMD Threadripper For Adobe Premiere Pro..」
 

 32コアの“暴れ馬”はこう乗りこなす ~【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch には、以下のとおり書かれています。(この記事の公開年月日は2018年9月29日)

32コアの“暴れ馬”はこう乗りこなす ~【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch

pc.watch.impress.co.jp メインストリームCPUが4コア、背伸びをして8コア……と言っていたのはわずか2年ほど前のこと。だが、今は32コア/64スレッドの「Ryzen Threadripper 2990WX」で超メニーコアPCが組めてしまう時代。論理64スレッドで何をするの? と問う奴は野暮の極みだ。確かにThreadripperはCPUの仕様もプラットフォームも普通のCPUと一味違う。安易に手を出せば火傷必至だが、ポイントさえ押さえれば普通の自作となんら変わりはない。どう組めばよいのか、どう乗りこなせばよいのか、パーツを手に試行錯誤しながら完成度を高めていけるのは、自作PCならではだ。前代未聞の32コアCPUの手なづけかたを解説する!

 

 ところが、エンコード系処理では意外な結果が。Premiere Pro CC 2018で編集した再生時間1分の8K動画を、Media Encoder CC 2018でMP4形式で書き出させても、体感的にはRyzen 7 2700Xと大差ない。CPU占有率を見ると、64コアの半分も使っていないことが分かった。Threadripperのコア1/2モード(16コア32スレッド)で動かすと、Blenderは1.5倍以上の時間がかかるのにMedia Encoder CCはほとんど差が出ず、H.264とH.265では後者のほうが処理の並列度が低いことも分かった。むしろLightroom CC 2018のシャープネス処理のほうがCPUをしっかり使ってくれている。32コアの暴れ馬は、ひどく乗り手(アプリ)を選ぶのだ。

(略)

 その一方で、Media Encoder CCでのエンコード処理は2990WXの1/2~1/4程度しか活用していない。とくにH.265ではほぼこんな状態で、低負荷なコア、仕事をしていないコアがいくつもある。アプリ側の改善が必要なようだ

 検証に使われた CPU は、Ryzen Threadripper 2990WX 32コア64スレッド。ビデオカードGeForce GTX 1080 Ti です。

GTX 1080 Ti グラフィックス カード - GeForce

www.nvidia.com

Introducing the GeForce GTX 1080 Ti – ULTIMATE GEFORCE - YouTube

youtu.be

 CUDA を有効にしたかどうか不明ですが、仮に CUDA を有効にしてエンコードした結果だとしても、ビデオカードの性能がボトルネックとなって CPU の使用率が低減したようには見えず、明らかに負荷がかかっていないコア、負荷がほとんどかかっていないコアが多数見られますので、Adobe Premire Pro CC は、Ryzen Threadripper 2990WX 32コア64スレッドに関しては別の原因で CPU の全コアを使い切れていないと考えられます。

<引用終了>


続きは後日
-