８コアCPUでお得なCPU＋マザーボード+メモリ（DDR4）＋SSDは？/ OpenCLでGPUプログラミング - 田口圭の日記（企業と経済：商法会社法etc の学習会）<p><a href="https://blog.hatena.ne.jp/taguchikei/taguchikei.hatenablog.com/entries">https://blog.hatena.ne.jp/taguchikei/taguchikei.hatenablog.com/entries</a></p>

メモ的な投稿です

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

OpenCL2入門メニーコアCPU＆GPGPU時代の並列処理 [ 北山洋幸 ]
価格：5832円（税込、送料無料) (2019/8/7時点)

楽天で購入

学習やるならNVIDIA一択？いや、AMDという選択肢がありますよ

深層学習で学習やるならNVIDIA一択？いや、AMDという選択肢がありますよ - Qiita

qiita.com

Radeon Open ComputeとHIP言語

　ImageNetでの画像認識ベンチマークのテストで過去の特徴エンジニアリングを伴う機械学習モデルのスコアを大幅に突き放しての優勝から、深層学習は機械学習・コンピュータサイエンスの分野で大きな注目を集める事となります。
　同時に深層学習に用いる各種ライブラリの発展の過程においてCuda環境というGPGPU開発環境を提供してきたNVidiaはかつてのゲーム用グラフィックチップの提供メーカーにとどまらない、GPGPUコンピューティングの雄として大きく飛躍することとなりました。

　一方でGPGPUの分野ではOpenCLを用いたAMDは、大きくこの分野において後れを取ることになりました。ゲーミング分野においても、DirectX12への移行が部分的にとどまったこともあり二番手にとどまっていたAMDは、GPU環境の開発において大きな奇策を打つことになりました。
　「基本的にプロプリエイタリなドライバ基盤の元で動作していたグラフィックアクセラレータを、ハードウェアにごく近い低位層の規格まで解放しGPUドライバ・およびその開発アプリケーションの成熟を狙う」GPUOpenプロジェクトを発表しましたが、その一環として「GPU を用いたコンピューティングの活性化を企図し、過去のCuda 開発資産をソフトウェアの書き換えをほとんど行うことなく活用できる、オープンソースのプロジェクトを展開する」というプロジェクトの声明として「Boltzmann Initiative」を提唱しました。Boltzmann Initiativeで提示された、RadeonOpenComputeの構成は以下のようになっています。

RadeonOpenCompute

　オープンソースなGPGPU アクセラレーション基盤として、専用のグラフィックドライバを含むROCkカーネルに、Cudaコンバージョンのデバイス側への低位の中間言語への翻訳を行うHCCと、CudaコンバージョンとしてCuda開発言語互換の処理を記述するHIP、そしてのちにはCuDNN相当のニューラルネットで用いられる畳み込み演算をはじめとした行列算のアクセラレーションを担うMIOpen、以上を統合した環境がRadeonOpenComputeです。

　RadeonOpenCompute(以下ROCmと表記)の取り組みは、発表から幾度か注目を集める事となります。「Caffeのソースコードの99パーセントを書き換えることなく、100行程度のコードの修正でAMD環境でもCaffeが動作する」というSC16でのAMDの発表2はNvidia社GPUからのAMD社GPUへの移行に大いに期待を抱かせるものでありましたし、2017年11月のNVidia社のEULA改訂に伴う「ワークステーション環境におけるコンシューマ向けGPU利用制限」はNVidia社の規約に振り回されることへの危機感を覚えるユーザーに逃避先としてのAMD社GPUの利用を検討させるものとなりました。
しかし、当時のROCmは環境のインストール、および対応ライブラリ両者の未成熟もあり、関心を寄せるユーザーの期待を裏切るものとなっていました。それに伴い、ROCmへの注目も大いに後退したものと考えられます。

　ROCmを取り巻く環境(2019年1月現在)

　2018年11月のAMD社イベントでROCm2.0が発表されました。ROCm2.0の特徴としてROCmカーネルの起動時のオーバーヘッドの削減や、MIOpenでのニューラルネット演算向けのFuse-Matrixの追加がうたわれました。この事でROCmの実行速度がより速くなることが期待されています。

　(2018年5月頃の環境)

　ROCmへの注視がされなくなる一方で、ROCmは着実に発展してきました。Cudaを開発言語の多くがCuda Toolkitで開発されている現状を踏まえてか、2017年からは公式レポジトリにCu*　Toolkit相当のBLAS, FFT,　Eigen他のツールキットが登録され、更新が行われています。

EigenでFFTする - wildpieの日記

wildpie.hatenablog.com

　また昨年2017年12月のROCmバージョン1.7においてDKMSを用いたカーネル管理が行われるようになり、専用のカーネルではなく公式のLinux最新カーネルに追従したまま利用ができるようになりました。

RX470で機械学習ことはじめその３～ROCmとTensorFlowのインストール～ - ニートが始めるUE4開発日誌

noroue4.hatenablog.com

　ROCkカーネルが管理する専用グラフィックドライバKFD（Kernel fusion Driver)はLinux カーネル4.17でLinux公式のデバイスドライバとなります。

AMD Posts Last KFD Kernel Patches For Discrete GPUs, Needed For Upstream ROCm - Phoronix

www.phoronix.com

CUDAをRadeonで動かす（導入編） - Fixstars Tech Blog /proc/cpuinfo

proc-cpuinfo.fixstars.com

　ROCm環境下で動作する深層学習ライブラリに関しても大きな進展がありました。四月初頭に更新されたMIOpenバージョン1.3において、再帰的ニューラルネットのサポート対応を発表、LSTMやGRUといったネットワークの演算もAMDGPUの恩恵が受けられるようになりました。

MIOpen - GPUOpen

gpuopen.com

　ROCmで動作する深層学習ライブラリに関しても、公式のブランチから遅れること半年でTensorFlowがバージョン1.3のモデルをベースにHIPポーティングされたことを皮切りとしてHIPポーティングがなされたPyTorchがROCm公式レポジトリに追加され、
またCuPyもHIPへの対応を企図している状況にあります。

www.codexa.net＜引用開始＞

　PyTorchとはPython向けのオープンソース機械学習ライブラリで、Facebookの人工知能研究グループにより初期開発されました。冒頭でも触れましたが、PyTorchは2016年後半に発表された比較的新しいライブラリです。現時点の最新の安定稼働バージョンは「0.4.1」となっており、現段階ではベータバージョンとしての位置付けとなります。

　PyTorchの原型は「Torch（読み：トーチ）」と呼ばれる機械学習ライブラリです。　Googleに買収されたDeepMind社もTensorFlow以前はTorchを利用していたと言われています。Torchは「Lua言語」で書かれていましたが、Pythonのサポートを行ったのがPyTorchです。

　2018年10月前半に待望の「PyTorch 1.0」の開発者向けプレビュー版がリリースされました。PyTorch 1.0のゴールはONNX（Open Neural Network Exchange）とCaffe2、さらにPyTorchの3つの良い部分を一つにまとめることにあります。

　多くのエンジニアが期待しているPyTorch １.0ですが、現在はプレビュー版です。本記事では安定稼働バージョンのPyTorch 0.4を扱います。

PyTorch

pytorch.org　Select your preferences and run the install command. Stable represents the most currently tested and supported version of PyTorch 1.1. This should be suitable for many users. Preview is available if you want the latest, not fully tested and supported, 1.1 builds that are generated nightly. Please ensure that you have met the prerequisites below (e.g., numpy), depending on your package manager. Anaconda is our recommended package manager since it installs all dependencies. You can also install previous versions of PyTorch. Note that LibTorch is only available for C++.

Anaconda - python.jp

www.python.jp

　Anaconda はデータサイエンス向けのPythonパッケージなどを提供するプラットフォームです。科学技術計算などを中心とした、多くのモジュールやツールのコンパイル済みバイナリファイルを提供しており、簡単にPythonを利用する環境を構築できます。

　Pythonのパッケージだけではなく、他言語のライブラリやいろいろなユーティリティも提供しており、NvidiaのGPUを利用する場合に必要な、CUDAなどの環境も簡単にインストールできるようになっています。

　Anacondはパッケージ管理ツールとして Conda コマンドを提供しています。 Python公式サイトの Pythonでは、パッケージは pipコマンドを使ってインストールしますが、Anacondaのパッケージは、Conda コマンドでAnacondaが管理・運用する専用のリポジトリからダウンロードし、Conda環境にインストールします。

　また、標準のPythonでは、仮想環境の管理は venv モジュールで行いますが、Anacondaでは、仮想環境も Codnaコマンドで提供しています。

＜引用終了＞

　RX500シリーズは前世代RX400シリーズから基本的にクロックを微増したほぼリネームといって良いAMDの最新GPUです。Polaris20のフルスペック版である「Radeon RX 580」からシェーダー・演算ユニットがカットされ、クロックも少しセーブされたGPUが「Radeon RX 570」となっています。

　カタログスペック上ではライバルとなるGefroce GTX 1060と比較すると、やや消費電力面で遅れを取っていますが、ビデオメモリ容量はGTX1060が3GB/6GBに比べて、RX570は4GB/８GBとアドバンテージがあります。

RX570がオススメと判断します

　　Radeon RX Vega 64 Air Boost 8G OC [PCIExp 8GB] MSI

　　¥34,460 　　ランキング1位 AMD
　　搭載チップRadeon RX Vega 64 　 SP数4096 メモリ（HBM2　　8GB）メモリバス2048bit メモリクロック945MHz バスインターフェイス PCI Express 3.0 x16 4K対応○ 補助電源8-pin x2 モニタ端子（HDMIx1　DisplayPortx3） HDMI端子1ポート DisplayPort3ポート幅x高さx奥行270x110x40mm 2018年 5月25日 2018年 5月25日

PUBG | R7 1700x | RX VEGA 64 | 1080p Ultra | Chicken Dinner - YouTube

www.youtube.com

GPU & CPU BENCHMARKS FOR MONERO MINING!

monerobenchmarks.infoRadeonはMonero（XMR）に向いていると言われますが

Home | Monero - secure, private, untraceable

web.getmonero.org

　　Radeon RX 570 ARMOR 8G [PCIExp 8GB] MSI
　　¥15,778 　　ランキング3位　　AMD
　　搭載チップRadeon RX 570 　 SP数2048 （メモリGDDR5　8GB）メモリバス256bit メモリクロック7000MHz バスインターフェイス PCI Express x16 4K対応○ 補助電源8-pin x1 モニタ端子（DVIx1　HDMIx1　DisplayPortx3）HDMI端子 DisplayPort1ポート 3ポート幅x高さx奥行246x130x39mm 2018年12月25日

AMD Radeon RX 570 -- AMD Ryzen 5 2600 -- PUBG FPS Test Miramar Ultra - YouTube

www.youtube.com

Radeon RX 570 ARMOR 8G MSI PCI Express 3.0x16対応グラフィックスボードMSI Radeon RX 570 ARMOR 8G
価格：15980円（税込、送料無料) (2019/8/7時点)

楽天で購入

「RX 570」のコスパが凄い。今なら「GTX 1050 Tiキラー」と呼べる。 | ちもろぐ

chimolog.co 　ものすごく今更なのは承知ですが、ここ最近2万円を割って1.8万台になるなど。異様なほど安価な「Radeon RX 570」についてレビューしました。1.8万なら、GTX 1050 Tiと2～3000円しか差が無いので、RX 570は「1050 Tiキラー」と呼べる神コスパグラボですね。

HIS RX570 4gb Ethereum mining 2019 update - YouTube

www.youtube.com

　イーサリアム（英: Ethereum）とは、分散型アプリケーション (DApps) やスマート・コントラクトを構築するためのプラットフォームの名称、及び関連するオープンソース・ソフトウェア・プロジェクトの総称です。イーサリアム・プロジェクトによって開発が進められています。

　イーサリアムでは、イーサリアム・ネットワークと呼ばれるP2Pのネットワーク上でスマート・コントラクトの履行履歴をブロックチェーンに記録していきます。またイーサリアムは、スマート・コントラクトを記述するチューリング完全なプログラミング言語を持ち、ネットワーク参加者はこのネットワーク上のブロックチェーンに任意のDAppsやスマート・コントラクトを記述しそれを実行することが可能になります。ネットワーク参加者が「Ether」と呼ばれるイーサリアム内部通貨の報酬を目当てに、採掘と呼ばれるブロックチェーンへのスマート・コントラクトの履行結果の記録を行うことで、その正統性を保証していきます。このような仕組みにより特定の中央管理組織に依拠せず、P2P全体を実行環境としてプログラムの実行とその結果を共有することが可能になりました。

　作者 Vitalik Buterin、Gavin Wood
　開発元 Gavin Wood、Jeffrey Wilcke、Vitalik Buterin等
　リポジトリ github.com/ethereum
　プログラミング言語 C++, Go, JavaScript, Python, Java, node.js
　対応OS Linux、Windows、macOS、POSIX準拠
　種別分散コンピューティング
　ライセンス GPL3、MIT、LGPL、等
　公式サイト www.ethereum.org

Home | Ethereum

ethereum.org

Building Enigma / The largest Ethereum Mining Facility - YouTube

www.youtube.com

Ethereum Vs. Bitcoin: What Sets Them Apart? | CNBC - YouTube

www.youtube.com

　　SAPPHIRE RADEON RX 5700 XT 8G GDDR6 HDMI/TRIPLE DP (UEFI) [PCIExp 8GB] SAPPHIRE　

　　¥48,428 　　ランキング5位　　AMD
　　搭載チップRadeon RX 5700 XT 　 SP数2560 メモリ（GDDR6　8GB）メモリバス256bit メモリクロック14000MHz(データレート)14Gbps(実効速度) バスインターフェイス PCI Express 4.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子（HDMIx1　DisplayPortx3） HDMI端子1ポート DisplayPort3ポート幅x高さx奥行272x111x36mm 2019年 7月7日

RX 5700 XT Apex Legends - PUBG - Fortnite | 1080p & 1440p Maxed & Competitive | FRAME-RATE TEST - YouTube

www.youtube.com

　　SAPPHIRE NITRO+ RADEON RX 590 8G GDDR5 DUAL HDMI/DVI-D/DUAL DP W/BP OC (UEFI) [PCIExp 8GB] SAPPHIRE
　　¥24,817 ランキング11位　　AMD
　　搭載チップRadeon RX 590 　 SP数2304 メモリ（GDDR5　8GB）メモリバス256bit メモリクロック8400MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源6ピン×1、8ピン×1 モニタ端子（DVIx1　HDMIx2　DisplayPortx2） HDMI端子2ポート DisplayPort2ポート幅x高さx奥行260x43x135mm 2019年 3月8日

RTX 2060 vs RX 590 Test in 8 Games - YouTube

www.youtube.com

　　SAPPHIRE PULSE RADEON RX 580 8G GDDR5 OC V2 [PCIExp 8GB] SAPPHIRE
　　¥20,745 12位　　AMD
　　搭載チップRadeon RX 580 　 SP数2304 メモリ（GDDR5　8GB）メモリバス256bit メモリクロック8000MHz(データレート) PCI Express 3.0 x16 4K対応○ 補助電源8ピン×1 モニタ端子（DVIx1　HDMIx2　DisplayPortx2） HDMI端子2ポート DisplayPort2ポート幅x高さx奥行230x125x40mm 2019年 3月1日

RX 580 vs GTX 1060 Test in 2019 - YouTube

www.youtube.com　1- 00:01 PUBG
　2- 01:40 Deus Ex Mankind Divided
　3- 03:35 Resident Evil 2 biohazard Re2 1-shot Demo
　4- 05:35 Strange Brigade
　5- 06:30 Assassin's Creed Odyssey
　6- 07:44 Battlefield V
　7- 09:22 Far Cry 5
　8- 10:29 Hitman 2
　9- 12:08 Shadow of the Tomb Raider

-

8コアCPUの価格一覧

＜１＞AMD　FX-8320E BOX ¥12,800

　 Socket AM3+ 8コア 95W 3.2GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 　発売日2014年 9月4日

FX-8320E | AMD

www.amd.com

AMD FX-8320E Eight-Core
　Average CPU Mark　7550
　Class: Desktop Socket: AM3+
　Clockspeed: 3.2 GHz
　Turbo Speed: 4.0 GHz
　No of Cores: 8 (in 4 physical modules)
　Typical TDP: 95 W

　Other names: AMD FX-8320E Eight-Core Processor
　CPU First Seen on Charts: Q4 2014
　CPUmark/$Price: 76.34 Overall Rank: 566
　Last Price Change: $98.9 USD (2019-08-07)　
　Single Thread Rating: 1366
　Samples: 1207*
　*Margin for error: Low

＜２＞FX-8350 BOX AMD　 ¥13,800　1

FX-8350 　 Socket AM3+ 8コア 125W クロック周波数4GHz 最大動作クロック周波数4.2GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 　発売日 2012年10月25日

FX-8320E | AMD

www.amd.com

TPDが高い（100W以上）

＜３＞FX-8320 BOX AMD　 ¥16,410

FX-8320 　 Socket AM3+ 8コア 125W クロック周波数3.5GHz 最大動作クロック周波数4GHz スレッド数 8 三次キャッシュ8MB 二次キャッシュ8MB 　発売日2012年10月25日

TPDが高い（100W以上）

＜４＞Xeon E5-2609 v4 BOX インテル　 ¥17,359

Xeon E5-2609 v4 BOX ¥17,359 Xeon E5-2609V4(Broadwell-EP) 　 LGA2011-3 8コア 85W 1.7GHz 　スレッド数 8 三次キャッシュ20MB 　　発売日2016年 4月11日

インテル® Xeon® プロセッサー E5-2609 v4 (20M キャッシュ、1.70 GHz) 製品仕様

ark.intel.com　コアの数 8
　スレッド数 8
　プロセッサー・ベース動作周波数 1.70 GHz
　キャッシュ 20 MB SmartCache
　バススピード 6.4 GT/s QPI
　QPI リンク数 2
　TDP 85 W　
　VID 電圧範囲 0

　対応ソケット FCLGA2011-3　最大 CPU 構成 2　

＜対応マザーボード１＞EPC612D4I ASRock
　EPC612D4I ¥38,691 　INTEL
　C612 Mini ITX LGA2011-3 　 S.O.DIMM DDR4 4 　　 1本　　　 SATA6.0G 4本　　　　　　 ○ 　　 10/100/1000 ○ - Aspeed AST2400 2016年11月21日
　サーバー用CPUなのに、S.O.DIMMが使えるMini ITXとは珍しい

ー
＜対応マザーボード２＞Z10PA-U8 ASUS
　Z10PA-U8 ¥44,590 　INTEL
　C612 ATX LGA2011-3 　 DIMM DDR4 8 512GB 1本 2本 3本　　 SATA6.0G 9本　　　　　　 ○ 　　 10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
＜対応マザーボード３＞X10DRL-i SUPERMICRO
　X10DRL-i ¥44,602 INTEL
　C612 ATX LGA2011-3 2 DIMM DDR4 8 　　 1本 5本　　 SATA6.0G 10本　　 5 　　　 ○ 　　 10/100/1000 ○ - Aspeed AST2400 2014年 9月16日
＜対応マザーボード４＞C7X99-OCE SUPERMICRO
　C7X99-OCE ¥44,603 　 INTEL
　X99 ATX LGA2011-3 　 DIMM DDR4 8 64GB 　 4本　 2本　 SATA6.0G 10本　　　 ○ 　　　 ○ 　　 10/100/1000 ○ RealTek ALC1150 - 2015年 4月8日
＜対応マザーボード５＞X10SRL-F SUPERMICRO
　X10SRL-F ¥46,100 4店舗 - 0.00
　 INTEL
　C612 ATX LGA2011-3 　 DIMM DDR4 8 　　 2本 5本　　 SATA6.0G 10本　　　　　　 ○ 　　 10/100/1000 ○ - Aspeed AST2400 2014年 9月11日

サーバー用だけあって、mini-ITX対応が一種類のみ。

ASRock EPC612D4I [マザーボード Intel C612/LGA2011-3/DDR4(4 SODIMM)/ASPEED AST 取り寄せ商品
価格：52164円（税込、送料無料) (2019/8/7時点)

楽天で購入

＜５＞Ryzen 7 1700X BOX AMD　¥19,062
Ryzen 7 1700X 第1世代 Socket AM4 8コア 95W 3.4GHz 最大動作クロック周波数3.8GHz スレッド数 16 ○ 三次キャッシュ16MB 二次キャッシュ4MB 　発売日2017年 2月23日

AMD Ryzen™ 7 1700Xプロセッサー | AMD

www.amd.com

i5 9400F vs Ryzen 7 1700 Test in 8 Games - YouTube

www.youtube.com（ある程度スコアが出ているようです）
参考：Core i5 9400F BOX
　プロセッサ名 Core i5 9400F(Coffee Lake-S Refresh) 世代第9世代ソケット形状 LGA1151 コア数 6 コアTDP 65 W クロック周波数 2.9GHz最大動作クロック周波数 4.1 GHz スレッド数 6マルチスレッド非対応　三次キャッシュ 9 MB

値

　AMD Ryzen 7 1700X
　Average CPU Mark　14680
　Class: Desktop Socket: AM4
　Clockspeed: 3.4 GHz
　Turbo Speed: 3.8 GHz
　No of Cores: 8 (2 logical cores per physical)
　Typical TDP: 95 W

　Other names: AMD Ryzen 7 1700X Eight-Core Processor
　CPU First Seen on Charts: Q1 2017
　CPUmark/$Price: 89.52 Overall Rank: 158
　Last Price Change: $163.99 USD (2019-07-23)
14680

　Single Thread Rating: 1881
　Samples: 1831*
　*Margin for error: Low

値

　Intel Core i5-9400F @ 2.90GHz
　Average CPU Mark　12135
　Socket: FCLGA1151
　Clockspeed: 2.9 GHz　
　Turbo Speed: 4.1 GHz
　No of Cores: 6
　Typical TDP: 65 W

　Other names: Intel(R) Core(TM) i5-9400F CPU @ 2.90GHz
　CPU First Seen on Charts: Q1 2019
　CPUmark/$Price: 80.91 Overall Rank: 236
　Last Price Change: $149.99 USD (2019-08-04)
12135

　Single Thread Rating: 2394
　Samples: 392*
　*Margin for error: Low

<6>Ryzen 7 1800X BOX AMD ¥22,000

Ryzen 7 1800X 第1世代 Socket AM4 8コア 95W クロック周波数3.6GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB 　発売日2017年 2月23日

<7>Ryzen 7 2700 BOX AMD ¥23,731 23位 (15票) 202件 Ryzen 7 2700 第2世代 Socket AM4 8コア 65W クロック周波数3.2GHz 最大動作クロック周波数4.1GHz 16 ○ 16MB 4MB 　発売日2018年 4月17日

TPDが低くて良い（65W）

値

　AMD Ryzen 7 2700
　Average CPU Mark　15000
　Class: Desktop Socket: AM4
　Clockspeed: 3.2 GHz
　Turbo Speed: 4.1 GHz
　No of Cores: 8 (2 logical cores per physical)
　Typical TDP: 65 W

　Other names: AMD Ryzen 7 2700 Eight-Core Processor
　CPU First Seen on Charts: Q2 2018
　CPUmark/$Price: 77.74 Overall Rank: 151
　Last Price Change: $192.96 USD (2019-08-07)
　15000

　Single Thread Rating: 1991
　Samples: 828*
　*Margin for error: Low

<8>Ryzen 7 1700 BOX AMD Ryzen 7 1700 BOX ¥24,800

Ryzen 7 1700 第1世代 Socket AM4 8コア 65W クロック周波数3GHz 最大動作クロック周波数3.7GHz 16 ○ 16MB 4MB 　発売日2017年 2月23日

TPDが低くて良い（65W）

<9>Ryzen 7 2700X BOX AMD ¥26,784 10位 (51票) 1019件 Ryzen 7 2700X 第2世代 Socket AM4 8コア 105W クロック周波数3.7GHz 最大動作クロック周波数4.3GHz 16 ○ 16MB 4MB 　発売日2018年 4月17日

TPDが高い(100W以上)

<10>Ryzen Threadripper 1900X BOX ¥31,450

Ryzen Threadripper 1900X 第1世代 Socket TR4 8コア 180W クロック周波数3.8GHz 最大動作クロック周波数4GHz 16 ○ 16MB 4MB 　発売日2017年 9月1日
TPDが高い(100W以上)

-

１６スレッドある、Ryzen 7 1700Xがお得かと。

【送料無料】 Linuxとpthreadsによるマルチスレッドプログラミング入門プログラミング基礎講座 / 渋谷克智【本】
価格：2592円（税込、送料無料) (2019/8/7時点)

楽天で購入

↑C言語の基礎的な知識が必要

並行コンピューティング技法　実践マルチコア／マルチスレッドプログラミング／ClayBreshears／千住治郎【合計3000円以上で送料無料】
価格：3456円（税込、送料無料) (2019/8/7時点)

楽天で購入

↑
Intelの技術者が著者
並行コンピューティングの原則が理解できます

-
socket AM4/ mini ITXのマザーボード

　Mini-ITX（ミニ・アイティーエックス）は、台湾のVIA Technologies社が開発したマザーボードのフォームファクタ（規格）。MicroATXやFlexATXといった小型ATX規格よりも顕著に小さく、わずか17センチメートル四方である。さらに小さなNano-ITX（ナノ・アイティーエックス、大きさ12cm四方）や、Pico-ITX（ピコ・アイティーエックス、10cm×7.2cm）がある。

＜１＞A320M-ITX ASRock　A320M-ITX ¥9,999 45位 (4票) 0件 AMD　チップセットA320 Mini ITX CPUソケットSocketAM4 　 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB 　 PCI-Express 16X（1本）　　　 SATA6.0G SATA（4本）　　 VRMフェーズ数（8）　　 USB Type-C○ USB3.1 Type-A/USB3.1 Type-C ○ 　無線LAN（無し）　オンボードLAN10/100/1000 オンボード RAID○ オーディオRealtek ALC1220 - 2018年 5月11日

ASRock > A320M-ITX　←Asrockさんwindowsサーバー使っているんですね

www.asrock.com ・AMD AM4 ソケット Ryzen シリーズ CPU に対応 (Summit Ridge, Raven Ridge および Pinnacle Ridge)
・DDR4 3466+ (OC) (Ryzen CPU)
・1 PCIe 3.0 x16
・グラフィックス出力オプション: 2 HDMI
・7.1 チャンネル HD オーディオ (Realtek ALC1220 オーディオコーデック)
・ニチコン製ファインゴールドシリーズオーディオコンデンサ
・4 SATA3, 1 ウルトラ M.2 (PCIe Gen3 x4)
・6 USB 3.1 Gen1 (1 Type-C, 前面に 2 個、背面に 3 個)
・Intel® ギガビット LAN

Realtek ALC1220

自作PCで地味に悩む「マザーボード」の選び方を詳しく解説 | ちもろぐ

ハイエンド：
ALC 1220 サンプリングレート（入力 / 出力）（192 kHz/192 kHz） SN比（入力 / 出力）（108dB/121dB）オーディオチャンネル（ 7.1 +2）
ミドルクラス：
ALC 887 サンプリングレート（入力 / 出力）（192 kHz/192 kHz） SN比（入力 / 出力）(90dB/97dB) オーディオチャンネル(7.1)
ASRock
112 台北市北投区中央南路二段37号2階
2F., No.37, Sec. 2, Jhongyang S. Rd., Beitou District,
Taipei City 112, Taiwan (R.O.C.)

＜２＞B350I PRO AC MSI　B350I PRO AC ¥12,950 194位　(2票) 0件 AMD　チップセットB350 Mini ITX CPUソケットSocketAM4 　 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB 　 PCI-Express 16X（1本）　　　 SATA6.0G SATA（4本）　　　 DisplayPort数（1）　USB Type-C無 USB3.1 Type-A ○ 　 IEEE802.11a/b/g/n/ac USB3.0○ オンボードLAN10/100/1000 オンボード RAID○ オーディオRealtek ALC887 -2018年 3月26日

B350I PRO AC | Motherboard - The world leader in motherboard design | エムエスアイコンピュータージャパン

jp.msi.com ・Supports AMD® Ryzen™ 1st and 2nd Generation/ Ryzen™ with Radeon™ Vega Graphics Processors and AMD® A-series / Athlon™ Processors for Socket AM4
・DDR4-3200+(OC)メモリ対応
・DDR4 Boost: MSI OCラボの高度な技術で可能になった、オーバークロック性能に対する最大の互換性を保証
・Turbo M.2: 最大32Gb/sの高速伝送
・Audio Boost: 最高のゲーム体験を可能にする、高品質のオーディオプロセッサを備え分離されたオーディオ
・PCI-E Steel Armor: 曲げや電磁干渉からグラフィックスカードを保護
・EZ Debug LED: トラブルシューティングへの最短の近道
・VR READY: 遅延知らずでモーション酔いを低減する最高のバーチャルリアリティゲーム体験
・X-Boost: お持ちのUSBとストレージの性能を大幅に向上させるツール
・Click BIOS 5: 高精細スケーラブルフォント、お気に入り機能、検索機能を備えた定評あるBIOS

MSI：台北微星服務中心
　No. 11-1號, Songjiang Road, Zhongshan District, Taipei City, 台湾 104

＜３＞B450I GAMING PLUS AC MSI　B450I GAMING PLUS AC ¥14,254 31位　(9票) 29件 AMD　チップセットB450 Mini ITX CPUソケットSocketAM4 　 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB 　PCI-Express 16X（1本）　　　 SATA6.0G SATA（4本）　　 VRMフェーズ数（9） DisplayPort数（1）　USB Type-C無　 USB3.1 Type-A USB3.0○ 　無線LAN（ IEEE802.11a/b/g/n/ac） ○ オンボードLAN10/100/1000 オンボード RAID○ オーディオRealtek ALC887 - 2018年 7月31日

＜４＞Fatal1ty B450 Gaming-ITX/ac ASRock　Fatal1ty B450 Gaming-ITX/ac ¥14,594 20位　(8票) 32件 AMD　B450 Mini ITX CPUソケットSocketAM4 　 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB 　PCI-Express 16X（1本）　　　 SATA6.0G SATA（4本）　　VRMフェーズ数（ 8） DisplayPort数（1）　 USB Type-C○ USB3.1 Type-A/USB3.1 Type-C USB3.0○ LED制御機能（Polychrome SYNC）無線LAN（IEEE802.11a/b/g/n/ac） ○ オンボードLAN10/100/1000 オンボード RAID○ オーディオRealtek ALC1220 - 2018年 7月31日

ASRock RGB Sync

www.asrock.com　ASRock Polychrome RGBは、すべてのユーザーが、パーソナライズされた優れた照明効果を実現できるように設計されています。マザーボード上でカラー、エリア、照明効果、パターンを調整できるだけではなく、ASRock Polychrome SYNC機能を使って、メモリ、ケース、ファン、クーラー、他のコンポーネントを同期させ、素晴らしいカラフルな照明効果を作りだすことができます。

＜５＞Fatal1ty AB350 Gaming-ITX/ac ASRock　Fatal1ty AB350 Gaming-ITX/ac ¥14,626 46位 5.00　(2票) 103件 AMD　チップセットB350 Mini ITX CPUソケットSocketAM4 　 DIMM DDR4 メモリスロット数2 最大メモリー容量32GB 　 PCI-Express 16X（1本）　　　 SATA6.0G SATA（4本）　　VRMフェーズ数（ 8）　　 USB Type-C○ 　 USB3.0○ 　無線LAN（IEEE802.11a/b/g/n/ac） ○ オンボードLAN10/100/1000 オンボード RAID○ オーディオRealtek ALC1220 - 2017年 6月30日

<参考１>チップセットの違い

Socket AM4 Platform | AMD

www.amd.com

チップセット	X370	B350	A320	X300	A300
ロゴ
ターゲット	性能重視	コスパ重視	低価格向け	小型PC向け
オーバークロック	可能	可能	不可	可能	不可
PCIe構成（GPU）	x16接続 x1			x16接続 x1
PCIe構成（GPU）	x8接続 x2	–		x8接続 x2	–
マルチGPU技術	SLI	CrossFire	–	SLI	–
マルチGPU技術	CrossFire	–		CrossFire	–
SATA	6本	4本		2本
SATA	NVMe 2本
SATA Express	2本	1本		0本
PCI Express	x8 Gen2	x6 Gen2	x4 Gen2	x4 Gen3	x4 Gen3
PCI Express	※ x4 NVMeがない場合、x2 Gen3を追加
SATA RAID構成	RAID 0			RAID 0
	RAID 1			RAID 1
	RAID 10			–
USB 3.1 Gen2	2		1	0
USB 3.1 Gen1	10	6		4
USB 2.0	6			0

　X300とA300は小型・薄型パソコン向けのチップセットで一般向けにはほとんど流通していない

B450なども含めた表

AMD 400 シリーズチップセットの組み合わせでのみ有効となります。

		X470	B450	X370	B350	A320
CPUソケット		Socket AM4
メモリ	最大スロット数	4（チップセットの最大限であり、実装はM/Bによる）
メモリ	最大容量	64GB（チップセットの最大限であり、実装はM/Bによる）
PCI-Express	Gen	2.0	2.0	2.0	2.0	2.0
PCI-Express	レーン数	8	6	8	6	4
マルチGPU	SLI	○	×	○	×	×
マルチGPU	CrossFireX	○	○	○	○	×
USB	3.1	2	2	2	2	1
	3.0	6	2	6	2	2
	2.0	6	6	6	6	6
SATA	6.0Gb/s	4	2	4	2	2
SATA	Express	2	1	2	1	1
RAID	SATA	〇(0/1/10)	〇(0/1/10)	〇(0/1/10)	〇(0/1/10)	〇(0/1/10)
RAID	NVMe	〇(0/1/10)	〇(0/1/10)	〇(0/1/10)	〇(0/1/10)	×
AMD StoreMI		○	○	×	×	×
OverClocking		○	○	○	○	×
XFR2		○	○	○	○	○
XFR2 Enhanced		○	○	×	×	×
Precision Boost Overdrive		○	○	×	×	×

B450/X470 AMD 400 シリーズチップセットスペック比較表

オーバークロックする予定にないならAC320でいいと思います

<参考２>
マルチGPUは
　CrossFire（クロスファイア）およびCrossFireX（クロスファイアエックス）は、ATI Technologies（現AMD）が開発したマルチGPU技術。CrossFire/CrossFireX対応グラフィックスカード（ビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ）を、同一のマザーボード上に複数枚挿入し、それらを電気的に接続する。複数個のGPUによる並列処理により、処理能力の大幅な向上が期待できる。AMD製チップセットを搭載したマザーボードに限らず、インテル製チップセットを搭載したマザーボードでも構築できる点が大きな特徴といえる
　↑
　B450とB350が対応　A320は非対応

　Scalable Link Interface (SLI、スケーラブル・リンク・インターフェース) とは、NVIDIAのマルチGPU動作システムである。2枚あるいはそれ以上のSLI対応グラフィックスカード（ビデオカード、ビデオボード、グラフィックスボード、グラフィックスチップ）を並列動作させ、出力は1つに集約させることで、コンピュータグラフィックスの描画処理を高速に行なうことができる。派生した規格としてHybrid SLIがある

<参考３>
無線LAN　は
　必要になったら１０００－２０００円程度で、/ac対応の無線LANアダプタが買えます

<参考４>
最大メモリ容量

　動画編集には１６GBあれば十分かなと
　ちなみに６４GBまで使えるMB（マザーボード）になると、３万５０００円くらい値段になります

<参考５>
　フォームファクタはMini-ITXで選びました

メモリ：DIMM DDR4　

（DIMM DDR4 メモリ）

相場　8GB DDR4 2400MHz PC4-19200 （Single Rank 8GB）
で、４０００円～４５００円くらいですね
２枚１６GBで８０００円～９０００円ほど

参考：

　トランセンド・インフォメーション（Transcend Information, Inc.、TWSE: 2451）は、台湾台北市に本拠地を置き半導体メモリ製品を中心に製造を行う企業である。1988年8月に Peter Shu（束崇萬）によって設立された。アメリカ合衆国、ドイツ、オランダ、イギリス、日本、香港、中華人民共和国、インド、韓国に支社を持つ。

　日本法人はトランセンドジャパン株式会社（Transcend Japan、1996年12月設立）で、本社は東京都台東区蔵前1-8-5 トランセンドビル

Transcend のメモリを使うと１枚５４８０円位かかります。
　５４８０円×２＝１万０９６０円

Transcend 増設メモリ 8GB DDR4-2666 PC4-21300 U-DIMM TS1GLH64V6B
価格：5480円（税込、送料無料) (2019/8/7時点)

楽天で購入

【メモリ屋社長のちょっとタメになるメモリ話】Ryzenで話題になった、メモリの”Rank”って何のこと? - PC Watch

pc.watch.impress.co.jp

＜引用開始＞
メモリのRankとは?

　さて、第1回はやはりメモリのお話をしようと思うのですが、社内でも今話題になっているのは、先日登場したAMDのRyzenです。コストパフォーマンスがよく、対応メモリも2666(2667)までとIntelを追い抜き、久しぶりにAMDの反撃を予感させてくれる製品です。

　ところが、どうもメモリ周りの仕様が少々ややこしく、搭載枚数だけでなく、搭載するメモリのRankによっても速度が変わってくるようです。2DIMMの場合、シングルRankだと2,667MHzで動きますが、デュアルRankだと2,400MHz止まり、4DIMMだとそれぞれ2,133MHz、1,866MHzとなります。Rankというのはメモリの動作単位なのですが、今回はこのRankについて解説したいと思います。

　自作PCで使われるメモリはDIMM(Dual Inline Memory Module) と呼ばれるモジュールタイプのメモリですが、DIMMは基本的に64bitのバス幅を持っており、CPU、あるいはチップセットのメモリコントローラと64bit単位でデータのやりとりを行ないます。DIMMには複数のDRAMチップが搭載されており、必ずこの64bitの単位を構成できるようになっています。

　そして、1枚のDIMMに64bitになるDRAMのグループが1つであれば1Rank、2つであれば2Rankとなります。メモリコントローラはRank毎にやりとりを行なうので、2Rankメモリでは電気的には2枚のメモリが刺さっていることになり、メモリコントローラによっては速度が下がる、搭載できる枚数が減るなど、制約が発生する場合があります。

　それでは、Rankの判別はどうするかですが、基本的にはスペック表記で判断して頂くことになります。時々「DRAMが片面に実装されていたら1Rank、両面に実装されていたら2Rank」という判別方法を聞きますが、間違いです。確かにそれでも結果的には合っている場合が多いのですが、両面実装で1Rankのメモリも存在します。

　また、直接Rankの記載がなくとも、DRAMチップに記載されている型番などからDRAMの仕様がわかれば、Rankの計算をすることはできるのですが、それにはDRAMの構成を理解する必要があります。

DDR4

　DRAMには、例えば同じ4Gbでも、1024Mb x4や512Mb x8など、内部の構成に違いがあります。内部の構造を簡単に表したものが上の図です。
＜以上引用＞

OS起動用ストレージ

　M.2　 SSD（OS起動用）１GBあたりの価格順
　
参考：M.2　 SSDのサイズ規格

　type2280(22×80)
　type2260(22×60)
　type2242(22×42)

＜１＞インテル（1GBあたりの価格¥11）
SSD 660p SSDPEKNW020T8X1 ¥22,980 24位
(1票) 4件 2048GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間　1GBあたりの価格 ¥11 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大)：220000 IOPS ランダム書き込み(8GB スパン) (最大)：220000 IOPS 発売日2018年 9月21日

Intel SSDPEKNW020T8X1 [2TB/SSD] PCIe Gen3 x4/M.2/SSD 660p シリーズ/NVMe/コンシューマ向けQLC M.2モデル
価格：24998円（税込、送料無料) (2019/8/7時点)

楽天で購入

＜２＞インテル（¥12）
540s Series SSDSCKKW480H6X1 ¥5,980 121位
(0票) 0件 480GB M.2 (Type2280) Serial ATA 6Gb/s TLC 内蔵 MTBF(平均故障間隔)160万時間 2.38mm 1GBあたりの価格¥12 読込速度(560MB/s) 書込速度(480MB/s) ランダム読込速度Random 4 KB Reads: up to 78000 IOPS Random 4 KB Writes: up to 85000 IOPS 発売日2016年 4月14日
＜３＞crucial（¥12）
MX500 CT1000MX500SSD4/JP ¥12,380 68位
(3票) 0件 1000GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵　　1GBあたりの価格 ¥12 読込速度(560MB/s) 書込速度(510MB/s) ランダム読込速度Random Read：95K IOPS Random Write：90K IOPS 発売日2018年 4月28日
＜４＞インテル（¥12）
SSD 660p SSDPEKNW010T8X1 ¥12,203 20位
(2票) 16件 1024GB M.2 (Type2280) PCI-Express 3D NAND QLC 内蔵 ○ MTBF(平均故障間隔)160万時間　 1GBあたりの価格¥12 読込速度(1800MB/s) 書込速度(1800MB/s) ランダム読み出し(8GB スパン) (最大)：150000 IOPS ランダム書き込み(8GB スパン) (最大)：220000 IOPS 発売日2018年 9月21日
＜５＞旭東エレクトロニクス（ ¥12）
SUNEAST SE800-n512GB ¥6,174 135位
(1票) 0件 512GB M.2 (Type2280) Serial ATA 6Gb/s 3D TLC NAND 内蔵 MTBF(平均故障間隔)200万時間 3.5mm 1GBあたりの価格¥12 読込速度(530MB/s) 書込速度(500MB/s) 　　発売日2017年11月20日

参考：〒530-0047 大阪府大阪市北区西天満５丁目９−３　旭東エレクトロニクス

M.2 と Hyper M.2 や Ultra M.2 の違い

direct.pc-physics.com以下は、両者の対応インターフェース規格です。

M.2	Serial ATA 6.0 Gbps PCI Express 2.0 x4
Hyper M.2 Ultra M.2	Serial ATA 6.0 Gbps PCI Express 3.0 x4

　両者を比べると、対応している PCI Express のリビジョンに違いがあります。M.2 は PCI Express 2.0 に対応しており、Hyper M.2 や Ultra M.2 は PCI Express 3.0 に対応しています。つまり、Hyper M.2 や Ultra M.2 の方が、データ転送速度が速いです。

M.2
　M.2 (Type2242)
　2242は基板の外形寸法（幅ｘ長さ） 22mm x 42mmを意味します。
　M.2 SSDの規格で一番小さな大きさとなります。

　 type2280(22×80)
　type2260(22×60)
　type2242(22×42)

　速度

PCI Express 2.0 x4	20Gbps
PCI Express 3.0 x4	40Gbps

ちなみに、x4 は対応レーン数の上限を表しています。つまり、レーン数の上限は4ですが、x2（レーン数の上限は2）の場合もあります。レーン数が異なればデータ転送速度も異なります。

参考：NANDフラッシュ

1. SLC（シングルレベルセル）
メリット – 長所
　・もっとも寿命が長い
　・読み書き時、エラーが発生する確率が低い
　・幅広い温度環境で動作可能
デメリット – 短所
　・一般向けSSDでは最も高価なタイプ
　・大容量化はあまり進んでおらず、低容量の製品が多い

2. MLC（マルチレベルセル）
　メリット – 長所
　・SLCと比べて、かなり低コストになった
　・主流のTLCよりも堅牢性に期待できる
　デメリット – 短所
　・SLCほどの精度と耐久性は期待できない

3. TLC（トリプルレベルセル）
　メリット – 長所
　・一般人が入手できるSSDでは、最も安価なタイプ
　・大容量SSDも、十分に手が届く価格になった
　デメリット – 短所
　・MLCよりも耐久性能は悪く、エンタープライズ市場では見向きもされない

4. QLC（クアッドレベルセル）
　メリット – 長所
　・おそらく、SSD史上もっとも安価な製品が登場する
　デメリット – 短所
　・TLCよりも悪化するであろう耐久性能
　・実際に、QLC形式のNANDフラッシュを採用したSSDが登場してみないことに分かりませんが、基本的には更に安くなって、耐久度は落ちるというイメージです。

大体の予算：
　低価格で組む場合

CPU：
　Ryzen 7 1700X　¥19,062

【送料無料】AMD CPU Ryzen7 1700X AM4 YD170XBCAEWOF
価格：23746円（税込、送料無料) (2019/8/7時点)

楽天で購入

　
M/B：
A320M-ITX

ASRock AMD A320チップセット搭載 Mini-ITXマザーボード A320M-ITX[cb]
価格：11878円（税込、送料別) (2019/8/7時点)

楽天で購入

SSD(OS起動用)
【送料無料】intel（インテル） SSDPEKNW020T8X1 Intel SSD 660p Series 2TB

【送料無料】intel（インテル） SSDPEKNW020T8X1 Intel SSD 660p Series 2TB
価格：24998円（税込、送料無料) (2019/8/7時点)

楽天で購入

480GB SSD Intel インテル 540s 内蔵型 M.2 2280 SATA3.0 6Gb/s TLC R:560MB/s W:480MB/s 海外リテール SSDSCKKW480H6X1 ◆メ
価格：5999円（税込、送料無料) (2019/8/7時点)

楽天で購入

DDR4(DIMM)

トランセンド JM2400HLB-8G [8GB JM DDR4 2400 U-DIMM 1Rx8 (1024Mx8)]

トランセンド JM2400HLB-8G [8GB JM DDR4 2400 U-DIMM 1Rx8 (1024Mx8)]
価格：5280円（税込、送料無料) (2019/8/7時点)

楽天で購入

続きは後日

ー
動画編集ソフトが対応するスレッド数について

＜引用開始＞
　Adobe Premiere ProのエンコードではCPU全コア使い切れない？

　CUDA 有効時のエンコードだと CPU 全コアを使い切れないのか　
　CPU のコア数が多くても、ソフトウェアによっては全コアを使い切れません。

　エンコード処理であれば CPU の全コアを使い切るソフトウェアが多く、Adobe Premiere Pro も例外ではなさそうですが、CPU の全コアを使い切れていないという噂があったようです。

　Core i9とRyzen Threadripperのレンダリング・動画エンコード速度を比較してみた | パソコン工房 NEXMAG には、以下のとおり書かれています。(この記事の最終更新日は2018年1月31日)

　Adobe Premire Proでは、すべてのコアを使い切れていないという噂もあったので、真偽を確かめるべくエンコード処理中のタスクマネージャーも見てみました。

　(略)

　結論として、いずれの場合においても、すべてのコアを使用しきっていました。ただ、CUDAエンコード処理時においては、CPUの使用率が低減している状況が確認できました。グラフィックカードにGeForce GTX 1060を使用したのですが、グラフィックカードの性能がボトルネックになった可能性もあります。また、メモリ消費量も、CUDA使用時の方が高い状況が見られました。
　GeForce GTX 1060 グラフィックスカード | GeForce

www.nvidia.com　CUDA（Compute Unified Device Architecture：クーダ）とは、NVIDIAが開発・提供している、GPU向けの汎用並列コンピューティングプラットフォーム（並列コンピューティングアーキテクチャ）およびプログラミングモデルである。専用のC/C++コンパイラ (nvcc) やライブラリ (API) などが提供されている。なおNVIDIA製GPUにおいては、OpenCL/DirectComputeなどの類似APIコールは、すべて共通のGPGPUプラットフォームであるCUDAを経由することになる。
　CUDAを使ったGPUプログラミング超入門 - Qiita

qiita.com

CUDAとOpenCLどっちがいいの？ - Qiita

qiita.com

「異種混合環境での並列プログラミングのオープンな標準規格」、つまりGPGPUには特化していません。

　規格自体はKhronosが策定しており、Intel, AMD, ARMが推しています。一応NVIDIAでも動きますが、現状、やる気のなさがヒシヒシと伝わってくるので、NVIDIA社のGPUでOpenCLを書くのは特殊な事情がないならお勧めしません。

　デバイス側をOpenCL Cという独自拡張されたC言語（※OpenCL2.2からはOpenCL C++という特殊なC++14で書けるようになります）でホストとは別に書いて実行時に文字列で渡して、ホスト側でオンラインコンパイルします。ホスト側は普通のgccやclangなどのコンパイラが使えます。

　長所は、標準規格であり使える環境が多い点ですが、やはりCUDAには利用者数もライブラリ群の整備状況も負けてるので、取っ付きやすさという意味ではCUDAに負けます。とは言っても、昨今のGPUは倍精度演算はNVIDIAよりAMDの方が速かったりして、倍精度が必要な物理計算等でAMDのGPUが使いたかったらOpenCL一択です。
（とは言うものの今の世界、だいたいメモリのread性能に律速するので、倍精度演算性能そのものはそれほど重要でないことも多い）。

　他のCUDA採用ツールの事例

劇的に加速、GPUプロセッシング

www.wondershare.jp

NVIDIA® CUDA
　GPUプロセッシング技術により、HD動画および高品質ビデオH264AVCの動画変換のスピードがアップします。

動画入力：
　AVI, MP4, FLV, MKV（H264） MPEG2 PS, MPEG2 TS（MPEG1/2）。

動画出力：
　AVI, FLV, MP4（H264）

　図は、MPEG2TS形式HD動画の変換スピードをNVIDIA® CUDATM対応のVGAカードVIDIA GeForce9800GT）を使用した場合と使用しなかった場合の比較です。

CUDA フィモーラ

　マルチコアCPU搭載PC、マルチスレッドに対応　
　AMD、Intelのマルチコア搭載PCをご利用の場合、使用するCPU数をソフト上から自由に設定することが可能です。たとえ、お使いのPCにVIDIA® CUDA対応のVGAカードが搭載されていなくても、同時並行処理（マルチスレッド）により従来製品の300%アップのスピードで、高速動画変換が可能です。

戻ります

検証に使われた CPU は、以下の CPU です。

　・インテル Core i9-7980XE 18コア36スレッド
　・インテル Core i9-7960X 16コア32スレッド
　・インテル Core i9-7900X 10コア20スレッド
　・インテル Core i7-7820X 8コア16スレッド
　・インテル Core i7-7800X 6コア12スレッド
　・AMD Ryzen Threadripper 1950X 16コア32スレッド
　・AMD Ryzen Threadripper 1920X 12コア24スレッド

　エンコード処理の主な内容は、以下のとおりです。

　エンコード速度を計る為、解像度は4K（3840×2160）、60fpsの10分31秒あるH.264のmp4形式の動画を、フルHD（1920×1080）に変更し、60fpsのH.264 mp4形式で出力させたときの時間をストップウォッチで計測してみました。

　Adobe Premire Pro CC にて CUDA を有効にしてエンコード処理を行った場合は、CPU の全コアを使い切れていない状況になったようです。

　CUDA を無効にしても、使用環境、エンコード処理内容によっては CPU の全コアを使い切れていない状況になる可能性があるかもしれません。

　Adobe Premire Pro CC にて CPU の全コアを使い切れていないという噂の詳細についてわからないと、どのような条件で発生する可能性があるのか推測は難しいです。
　Ryzen Threadripper 2990WX 32コア64スレッドだと全コアを使い切れないのか
ASCII.jp：32コア64スレッドは乗りこなせるか？　第2世代「Ryzen Threadripper」を速攻で試す (4/6)｜最新パーツ性能チェックには、以下のとおり書かれています。

【レビュー】23万円の最強CPU「Ryzen Threadripper 2990WX」を買ったので自慢します！www - YouTube

www.youtube.com

YD299XAZAFWOF AMD AMD CPU 2990WX（Ryzen Threadripper）
価格：219800円（税込、送料無料) (2019/8/7時点)

楽天で購入

　クリエイター向けのCPUパワーを食う処理といえば動画エンコードがある。そこで4K動画4つを「Premiere Pro CC 2018」を利用してタイル状に並べ、再生時間約1分の8K動画にまとめ、それを「Media Encoder CC」を利用してH.264形式の8K動画に書き出す時間を比較する。ビットレートは50Mbps、2パスVBRでエンコードを行った。

　このテストではおかしなことに、32コア64スレッドの2990WXが、16コア32スレッドの1950Xより遅いというにわかに信じがたい結果が出た。そしてコア数で並ぶ2950Xと1950Xとの比較においても、アーキテクチャー的に新しい2950Xの方が負けている始末。CGレンダリングではあれだけ速いのに、動画エンコードではなぜか第2世代Threadripperは遅いのだ。

★◇AMD Ryzen Threadripper 1950X BOX 【CPU】【送料無料】

★◇AMD Ryzen Threadripper 1950X BOX 【CPU】【送料無料】
価格：81250円（税込、送料無料) (2019/8/7時点)

楽天で購入

プロセッサ名 Ryzen Threadripper 1950X 世代第1世代　約８万円
　ソケット形状 Socket TR4 コア数 16 コア　
　TDP 180 W クロック周波数 3.4GHz
　最大動作クロック周波数 4 GHz スレッド数 32　
　マルチスレッド ○ 三次キャッシュ 32 MB
　二次キャッシュ 8MB

今回の８コア（１６スレッドCPU）約２万円
　プロセッサ名 Ryzen 7 1700X 世代第1世代
　ソケット形状 Socket AM4 コア数 8 コア　
　TDP 95 W クロック周波数 3.4GHz
　最大動作クロック周波数 3.8 GHz スレッド数 16　
　マルチスレッド ○ 三次キャッシュ 16 MB
　二次キャッシュ 4MB

戻ります
　Ryzen Threadripper 2990WX の全コアを使い切れていないことを示す結果が得られたようです。

　GPU(ビデオチップ)の性能がボトルネックとなった可能性がありますが、Ryzen Threadripper 1950X よりも遅い結果が出た等を考慮すると、その可能性はないと考えられます。

　同記事によると、時間が限られていますので原因の特定はできませんでしたが、BIOS の熟成不足、評価用 CPU またはマザーボードの不具合、発熱とサーマルスロットリング、以上の原因が考えられるそうです。

　他の検証でも、Adobe Premire Pro のエンコード処理において Ryzen Threadripper 2990WX の全コアを使い切れていないことが確認できたようです。

興味深い

Don't Buy AMD Threadripper For Adobe Premiere Pro.. - YouTube

「Don't Buy AMD Threadripper For Adobe Premiere Pro..」

www.youtube.com

　32コアの“暴れ馬”はこう乗りこなす～【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch には、以下のとおり書かれています。(この記事の公開年月日は2018年9月29日)

32コアの“暴れ馬”はこう乗りこなす～【DIY PC 02】第2世代Ryzen Threadripperで実現する超マルチコアPC - PC Watch

pc.watch.impress.co.jp　メインストリームCPUが4コア、背伸びをして8コア……と言っていたのはわずか2年ほど前のこと。だが、今は32コア/64スレッドの「Ryzen Threadripper 2990WX」で超メニーコアPCが組めてしまう時代。論理64スレッドで何をするの? と問う奴は野暮の極みだ。確かにThreadripperはCPUの仕様もプラットフォームも普通のCPUと一味違う。安易に手を出せば火傷必至だが、ポイントさえ押さえれば普通の自作となんら変わりはない。どう組めばよいのか、どう乗りこなせばよいのか、パーツを手に試行錯誤しながら完成度を高めていけるのは、自作PCならではだ。前代未聞の32コアCPUの手なづけかたを解説する!

　ところが、エンコード系処理では意外な結果が。Premiere Pro CC 2018で編集した再生時間1分の8K動画を、Media Encoder CC 2018でMP4形式で書き出させても、体感的にはRyzen 7 2700Xと大差ない。CPU占有率を見ると、64コアの半分も使っていないことが分かった。Threadripperのコア1/2モード(16コア32スレッド)で動かすと、Blenderは1.5倍以上の時間がかかるのにMedia Encoder CCはほとんど差が出ず、H.264とH.265では後者のほうが処理の並列度が低いことも分かった。むしろLightroom CC 2018のシャープネス処理のほうがCPUをしっかり使ってくれている。32コアの暴れ馬は、ひどく乗り手(アプリ)を選ぶのだ。

(略)

　その一方で、Media Encoder CCでのエンコード処理は2990WXの1/2～1/4程度しか活用していない。とくにH.265ではほぼこんな状態で、低負荷なコア、仕事をしていないコアがいくつもある。アプリ側の改善が必要なようだ

　検証に使われた CPU は、Ryzen Threadripper 2990WX 32コア64スレッド。ビデオカードは GeForce GTX 1080 Ti です。

GTX 1080 Ti グラフィックスカード - GeForce

www.nvidia.com

Introducing the GeForce GTX 1080 Ti – ULTIMATE GEFORCE - YouTube

youtu.be

　CUDA を有効にしたかどうか不明ですが、仮に CUDA を有効にしてエンコードした結果だとしても、ビデオカードの性能がボトルネックとなって CPU の使用率が低減したようには見えず、明らかに負荷がかかっていないコア、負荷がほとんどかかっていないコアが多数見られますので、Adobe Premire Pro CC は、Ryzen Threadripper 2990WX 32コア64スレッドに関しては別の原因で CPU の全コアを使い切れていないと考えられます。

＜引用終了＞

続きは後日
-