自作PC」カテゴリーアーカイブ

CPUファン回転数が認識されなくなる原因判明

先日PCケースを開けて内部の清掃をしていました。清掃後に動作試験をしてみたところ、以前から時々発生していたCPUファン回転数が検出されなくなる問題の原因が判明しました。

ケースを開けた状態で何度か電源の入切をしてみて判明したのですが、回転数が検出できていないのではなく、実際にファンが回っていないことが分かりました。どうもコネクタ周辺で断線が起きているのか接触が中途半端で、ケーブルの状態によっては通電しなくなってしまうことがあるようです。

写真でも結構曲げがきついですが、黄色で囲ったあたりが怪しいと思っています。

今まではCPUファンの異常が起きるたびにきまってケースを開けて内部を点検していたので、点検の際にケーブルに手が触れて接触が復活していたんだと思います。

何にしてもこの状態は放置するとよくなさそうなので、どこかのタイミングでファンを交換してしまいたいと思っています。

Ryzen 5800Xで発生するCache Hierarchy Errorの対処

以前からゲーム中などにPCが突然再起動し、再起動後にVGAのドライバが正しく読み込まれず、”The Version of AMD Radeon Software…”というエラーが発生する現象が起きていました。

VGAのドライバが読めなくなるので再起動の原因も恐らくVGA周りだろうと思って原因究明についてはそこまでしっかりと行っていなかったのですが、先日Windowsのイベントログを眺めていたところ、このエラーが起きたときに”イベントID:18 WHEA-LOGGER エラーの種類:Cache Hierarchy Error”というエラーが記録されていることに気がつきました。

Cache Hierarchy Errorについて

イベントログの種類だけでは何のエラーなのかよく分からなかったので調べてみました。エラーの名前自体を直訳すると”キャッシュ階層エラー”になるので、恐らくCPUのキャッシュ階層(レジスタ→L1→L2→L3…)に関するエラーなのだろうなと言うところは推測できました。

その上でネット上を検索してみたのですが、なんとなく以下の傾向がつかめました。

  • 5000系Ryzenの報告例が多い(特に5950X)
  • CPUの電圧変動に起因するものという指摘が多い

対処法

仮説として多く指摘されており、自分としても納得できたのは以下の説です。

【仮説】

5000系RyzenはPBOにより自動オーバークロックする。オーバークロック時にCPUのクロック上昇が先行し、電圧が瞬間的に不足するタイミングがある。これを防ぐためにマザーボードは電圧を補正して供給する機能を備えているが、その機能の効き目が弱かった場合にCPUが電圧不足になりクラッシュする。

【対処法】

上記の仮説に従えば、以下の3種類の対処法が考えられます。

  • マザーボードのLLC(Load Line Calibration)設定を変更し、クロック変動時の電圧補正を強めにする
  • CPUの自動オーバークロックを停止し、クロック固定で使う
  • そもそもこのエラーが起きるCPUは初期不良の疑いがあるので交換する

自分の環境での対処

今回私は一番簡単に実行できるLLC設定の変更を行ってみました。私の使っているASUS ROG Strix X570-Fの場合、LLCの設定はUEFIを開いて AI Tweaker→DIGI+VRM→CPU Load-line Calibrarion で行います。結構深いところに設定があります。

デフォルトでここはAutoになっていますが、手動でLevel1-Level5に設定できます。Levelが低いほど補正が強くなるため、動作安定性という点では高くした方が良さそうに思いますが、同時に高負荷時の消費電力も大きくなるために一概に高くした方がいいというものでもないようです。

Autoの場合内部的にどのような設定になっているのかが分かりませんが、基本的にはレベルの高い方から始めて、動作が不安定なようなら徐々にレベルを1に近づけていくのが良いようです。今回私はいったんレベル4に設定してみて様子を見ています。

その他気になること

Redditなどを見ているとRMA(返品保証)一択という意見を述べている方も結構たくさんいらっしゃいました。確かにネット上の情報だけを見ると5950Xと5800Xの報告例が多いので、特定の製品や特定のロットに何らかの不良が集中していてもおかしくないような感じはあります。

今回原因の推定を行っていて思いましたが、昨今のCPUはいろいろなことがお任せ設定でできるようになった反面、このようにトラブルが起きる要因が増えている感もあります。基本的に自動でできるようになったのはラクで良いことだと思うのですが、内部的には複雑さが増しているというのは認識しておいた方が良いことだとは思います。

PCの内部配線整理

水冷PCを運用していると困るのがポンプに由来する振動の対処です。ポンプそのものの騒音はそこまで問題にならないことが多いですが、ポンプからの振動がしっかり固定されていない部品に伝わると、その部品からビビり音のような音が発生することがあります。

最近まさにそのような音が発生していて気になったので、固定の甘い部品がないか内部のチェックを行いました。

PCを動作させた状態で気になるポイントを手で押さえて確認してみたところ、フロントパネル裏についているラジエーターファンのケーブルが浮いているのが原因と分かりました。

ケースからちょっと浮いた感じになっているので、サイドパネルを閉めるとサイドパネルに接触しているようでした。
浮いているところをできるだけケースに沿わせるように固定したいところです。

固定方法を検討しましたがなかなかいい方法が思いつかず、手持ちの資材を見ていたらファンケーブルの延長ケーブルが数本あることに気がつきました。特にケーブルの長さが足りないわけではないのですが、ケーブルを延長すると右側のケーブル群とまとめて固定できそうでした。

そんなわけでケーブルを延長してすべてひとまとめにすることができました。これであればサイドパネル側にケーブルが浮くこともないので安心できます。

PC起動時にCPUファン回転数が認識されなくなるトラブル

先日PCを起動したところWindowsの読み込みが始まる前にUEFIの画面でCPUファンの回転数が検出できないというエラーが表示されて起動が進みませんでした。我が家のPCのCPUファン回転数は水冷ラジエーターのファン回転数を取得しているので、ラジエーターファンの回転を確認したところ実際のファンの回転自体には問題ないようでした。

一応念のために電源を切って、各ファンの結線を再度確認した上で起動すると問題なく起動しました。その後も念のために何度か再起動してみましたが再現はしていません。原因がはっきりしないので少々気になりますが、冷却用に搭載しているNoctua NF-P12も結構長期間使っていると思うので、そろそろ予防保守的に交換する時期なのかもしれません。

ROG Strix X570-F GamingのBIOS更新

年末からここまでPCが少々不安定だったというのもあったので、マザーボードのBIOSを久々に更新しました。更新前のバージョンはバージョン4802で、リリース日は2023/7/14でした。今回更新したバージョンは5021で、2024/11/1リリースのバージョンとなっています。

さすがにだいぶ前のマザーボードなのでこれによって大きく安定性が変わるとは思えませんが、念のためのメンテナンスというところです。

TPMを利用した暗号化との関係

BIOSの更新に伴ってTPM関連で注意すべき事項があるようでした。アップデートのインストールが終わり、これで再起動すれば完了となるところで、”WindowsのBitlockerなどのTPMを使った暗号化を行っている場合、このまま再起動するとリカバリーキーの入力が必要になりますがいいですか?(意訳)”というメッセージが英語で表示されました。

We detected a new fTPM firmware version/processor, which will change the data/structure of the storage space for firmware TPM.

If you did not apply fTPM function, please press Y to continue…

(この後この場合はY、この場合はNで進んでくださいと続きます。)

内部での挙動は詳しくわかりませんが、今回のBIOSアップデートでTPMに対応する暗号化キーの値が変わってしまうのかもしれません。もしBitlockerを有効にしている状態でそのまま再起動し、しかもリカバリーキーがわからない場合はシステムが起動できずに”詰み”となってしまうためかなり重要な確認ポイントだと思いました。

PCのシステムも高度化して安全性は高くなっていると思いますが、こういった注意点が増えるのは素直に喜べない部分でもあります。

(続)The Version of AMD Radeon Software…というエラー

以前表題のエラーに遭遇し、「ドライバをアンインストール後再度インストールしたところ解決した」というエントリを書きました。

エラー内容としては同じなのですが、ドライバの入れ直しで解消しないケースに遭遇したのでまとめておきたいと思います。

事象

発生のきっかけ

久々にSteamでKenshiを遊んでいたところ、突然ゲームがクラッシュしてPC自体が再起動してしまいました。Kenshiはクラッシュの多いゲームなのでこれ自体はあまり驚くことではないのですが、その後が普段と少々違いました。

症状

再起動後VGAのドライバがロードできず、3Dのアクセラレーションがかからない状態になってしまいました。デスクトップなどの画面表示に異常はありませんが、ゲームを実行するとfpsが15程度しか出ないという状態でした。

この状態でAMD Softwareを起動しようとすると表題のエラーが表示されました。

また、デバイスマネージャーでVGAの状態を確認すると、「問題が発生したのでこのデバイスは停止しました。 (コード 43)」というエラーが発生していました。

またデバイスのプロパティを詳しく見てみると、「amduw23gが読み込めず、デバイスが開始できない」旨のイベントログが残っていました。

対処(今回は効果のなかったもの)

デバイスドライバの入れ直しも含めて様々な対処を行いましたが、この時点では改善できませんでした。ただここに挙げた対策は一般的には有効とされているものばかりなので、同様のエラーが発生したときに試してみる価値はあると思います。

  • デバイスドライバの入れ直し
  • キーボードショートカットによるVGAのリセット(Ctrl+Shift+Win+B)
  • デバイスマネージャーでVGAを一旦無効にして再度有効にする
  • Windowsを起動後、”AMD Cleanup Utility”でドライバをきれいに削除して入れ直し
  • システムの復元

ここまでやってみてダメだったので、もうWindowsごとクリーンインストールすることにしてしまったのですが、Windowsを入れ直しても問題が解消しませんでした。

解決までの経緯

今回の問題はなぜか偶発的に解決してしまいました。行った操作はこのような形でした。

  1. クリーンな状態のWindowsにドライバをインストールしたところ、問題が解消していないことを確認
  2. 一旦セーフモードで起動し、AMD Cleanup Utilityを実行する準備をする(ドライバ削除後、ワークステーション用のPROドライバを入れてみるつもりだった)
  3. セーフモード起動時に「問題が発生したため、暗証番号「PIN」を使用できません。クリックして…」という全く関係ないエラーが発生
  4. PINを再設定しようとしたが、PIN再設定用の画面が一瞬表示されてすぐ消えるので設定できず
  5. ログイン画面でShiftキーを押しながら再起動し、Windows回復環境を起動してWindowsを初期化
  6. なぜかVGAドライバの問題が解消

PINの問題は全く関係ないように思うのですが、仕切り直しの意味で実行したWindowsの初期化により問題が解消しました。

原因と正しい対処の検討

結局何が悪いのかは良く分からなかったのですが、ネット上の情報を色々見ていると「Windows UpdateがRadeonのディスプレイドライバを上書きすることがあるので、Windows Update経由でデバイスドライバを入手しないようにした方が良い」という意見が多くありました。

AMD software not compatible with your graphics driver

[Reddit.com]

この設定は”システムの詳細設定”内の”ハードウェア”タブにあるデバイスのインストール設定というものです。デフォルトで有効になっていますが、Radeonだけなのか、この設定がトラブルの原因になるという指摘が多くありました。デバイスドライバは基本的に手動でまめに更新するので、私も今回の件を機に無効にしました。

今となっては詳しい検証が困難になってしまいましたが、この”本来読み込まれるべきドライバに対して別の何かが優先して読み込まれている”という状況は確かにありそうに感じます。

さすがにWindows自体を入れ直せば問題は解消しそうなものですが、それでも問題が起きたのはWindowsインストール時点で何らかのドライバがインストールされてしまったのではないかと思うからです。

結局別途AMDから入手したドライバをインストールしても問題は解消せず、”ドライバがある状態でWindowsの初期化をしたら解消した”わけですから、クラッシュ後に異常が起きたのはどちらかというとWindowsの挙動が原因ではないかという気がしています。

今思えば一番解決に近そうなのは

  1. AMD Cleanup Utilityを使用し、セーフモードでドライバを完全に削除
  2. セーフモード中にWindows Updateからデバイスドライバを入手しないよう設定変更
  3. 再起動後ドライバを再度インストール

だったかもしれません。

RadeonでAFMF2を手動でONにする

我が家のRX7600も含めてRX6000系と7000系はフレーム生成技術”AFMF2”を様々なゲームに適用することができます。

適用したい場合、基本的にはゲームごとの描画設定を”HYPR-RX”とし、要するにおまかせ設定にしてしまえばOKです。古いタイトルであっても、ドライバ側でAFMF2が適用可能と見なされると自動的にONにしてくれます。

そういった中でも自動的にONにならないタイトルがあり、その場合はユーザーの責任において手動でONにすることができます。

サポート外のゲームではこのような表示になります。

私の手持ちタイトルの中ではDiablo4が対象外となっています。手動でONにすると何か不具合が起きるのかと思って試しにONにしてみましたが、今のところは問題なくプレイできており、フレームレートもかなり向上しています。少々心配な点はありますが、設定をチューニングして一番良い状態を狙うのは楽しい作業です。

DDR5メモリの初回起動時トレーニング

興味深い話題が窓の杜さんに掲載されていました。

PCの起動に最大15分 ~DDR5メモリの更新には“トレーニング”が必要になることがある

[窓の杜]

記事によるとDDR5メモリと特定のUEFIの組み合わせで、PC構築後の初回起動時にトレーニング処理が実行され、長い時間起動していないように見えることがあるそうです。

特にメモリの容量が多いときに時間が長くなるようで、最近はメモリの搭載量も増えてきているので遭遇する確率は高そうに感じます。

私は今回この事象を初めて知りましたが、私は長らく自作PCを組み立てているので良くも悪くも経験ベースで作業をしてしまいがちなところがあります。あまり甘く見ずに時々は最新のプラットフォームでどのように組み立てを行うべきなのか等の情報を仕入れておくことも重要だと感じました。

12cmファンをデイジーチェーン接続する

我が家のPCは12cmファン3つを使う360サイズのラジエーターで冷却をしています。

ファンの電源は今までマザーボードのCPU用のものから1基分、CPUオプションコネクタをY字分岐して2基分の合計3基でまかなっていたのですが、1つのコネクタから3基分取れた方が配線がすっきりすると思ったので部品を調達しました。

アイネックスのCA-100Aという商品です。まさに360サイズのラジエーター向けに作られたような製品で、PWMファン3基をデイジーチェーン(数珠つなぎ)接続することができます。

一応制限事項としてマザーボードの電源コネクタ容量を上回らないことというのがあります。ファンについてはデータシートで消費電力が0.6Wということが分かりました。マザーボードの説明書にコネクタごとの出力は掲載されていませんでしたが、0.6Wx3であれば問題はないようです。

性能面が何か変わったというものではないですが、ケース内がちょっとすっきりしたので満足のいく小改造になりました。

ASUS Q-Fanのキャリブレーション

夏場のPC冷却設定の一環としてPCに搭載されているPWMファンのキャリブレーションをしてみました。

これはマザーボードのUEFI上で実行できるQ-Fanというファンコントロール用の機能からアクセスできます。自動最適化という名称で表示されます。実施するとマザーボードの方で自動的にファンをテスト動作させ、最低デューティ比を割り出してくれます。

最低デューティー比を現物にあわせて決定することにより、必要ないときにはファンを可能な限りの低回転まで落とすことができ、静音性が向上するというもののようです。

意図せず利用中にファンが止まって再始動しない場合や、交換したばかりのファンに関しては1回これで回転数下限を測定しておくと良さそうです。