Sie sind nicht angemeldet.

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

1

Donnerstag, 17. Oktober 2013, 13:31

Hardwareprobleme (Mainboard/Netzteil?)

Hallo zusammen,

seit einiger Zeit schon habe ich das Problem, dass mein Festplatzrechner gelegentlich neu startet bzw. hängen bleibt. Die genaue Symptomatik hat sich über die Monate leicht verändert. Aktuell ist es so, dass der Rechner, sofern das Problem auftritt, etwa 10 bis 20 Minuten nach dem Anschalten hängen bleibt und anschließend neu startet. Tritt das Problem nicht in dieser Zeit auf, läuft der Rechner problemlos durch. Nach dem ersten Reset kann es passieren, dass er erneut hängen bleibt. Das kann bereits beim Anzeigen der BIOS-Informationen passieren (dann ist ein manueller Reset nötig), kann aber auch sein, dass es erst nach dem Boot ins OS (Xubuntu 12.04) stattfindet. Gegebenenfalls wiederholt sich die Prozedur. Maximum waren bisher 4 Resets, die, sofern der erste auftritt, sich innerhalb kurzer Zeit die Hand geben.

Als die Probleme anfingen, waren es 1 bis 2 Systemabstürze/Kernel Panicks, daher dachte ich zuerst, es liegt evtl. am Betriebssystem. Aber seit vor einigen Wochen der Rechner nach dem ersten Reset bereits im BIOS hängen blieb, bin ich zu dem Schluss gekommen, dass die Hardware spinnt. Am wahrscheinlichsten erscheint mir Mainboard oder Netzteil. (Kondensatoren? Kaltlötstellen?) Leider kann ich weder das eine noch das andere zum Testen austauschen, daher wollte ich mich mal hier erkundigen, was ihr denkt. Zur Häufigkeit des Problems: Es kann sein, dass der Rechner über viele Tage keine Probleme macht, dann kann es an mehreren Tagen hintereinander (oder je nach An- und Ausschalthäufigkeit auch mehrmals täglich) auftreten. Das macht das Debugging noch langwieriger. Und einfach auf Verdacht was neues zu kaufen, um dann festzustellen "das war's nicht", möchte ich nach Möglichkeit vermeiden.

Hardwarekomponenten habe ich in der Zeit des erstmaligen Auftretens und auch lange danach nicht ausgetauscht. Kürzlich habe ich einen RAID-Controller ausgebaut, der war es nicht. Eine Auffälligkeit hatte ich vor diesen Problemen im Zusammenhang mit dem Mainboard. Unter Linux (verschiedene Ubuntu-Derivate) hatte ich teilweise das Problem, dass bei fehlender Maus- oder Tastaturaktivität das System einfror und bei erneuter Aktivität wieder aufwachte. So, als würde sich der Rechner vor lauter Langeweile schlafen legen, ohne tatsächlich in einen visuell erkennbaren Standbymodus einzutreten. Das konnte beim Booten, beim Herunterfahren oder beim normalen Betrieb auftreten, so dass ich zum Teil für das Hoch- oder Runterfahren Dummyeingaben über die Tastatur machen musste. Das hatte sich dann mit einem BIOS-Update erledigt. Keine Ahnung, ob zu den aktuellen Problemen eine Verbindung besteht.

Was denkt ihr dazu? Schonmal was ähnlich gehabt/gesehen? Freue mich über alle Anregungen und Hilfestellungen. :)

Rick

Mädchen

  • »Rick« ist männlich

Beiträge: 1 266

Registrierungsdatum: 17. März 2004

Wohnort: ::1/128

Beruf: Forentroll

2

Donnerstag, 17. Oktober 2013, 14:02

Ich geh mal davon aus, dass du einen langfristigen Speichertest durchgeführt hast, um den auszuschließen?
Ansonsten klingt es tatsächlich sehr nach einem Stromversorgungsproblem, da diese aber auf Mainboard und im Netzteil stattfindet gibt es da keine Patentlösung. Meine Erfahrung geht dahin, immer zuerst das Netzteil zu vermuten, (und ich empfehle den meisten mit instabilem Rechner ein Netzteil zui kaufen - im schlimmsten Fall hat man dann ein Tauschgerät für wenn das Netzteil tatsächlich stirbt) und auch in diesem Fall ist es vermutlich so - außer das Mainboard ist signifikant älter / billiger als das Netzteil.

Da es außerdem leichter zu tauschen ist als ein Mainboard, ist das immer meine erste Idee.

Leider kommst du aber am Ende nicht drumherum die Komponenten durchzutesten. Vielleicht kennst du ja wen, der dir ein Netzteil zum testen leihen kann.

Sometimes you've got to ask yourself: Is xkcd shitty today?

sos1981

Alter Hase

  • »sos1981« ist männlich

Beiträge: 1 562

Registrierungsdatum: 28. Oktober 2003

Wohnort: Wolfsburg

Beruf: Testentwickler

3

Donnerstag, 17. Oktober 2013, 14:03

ich hatte mal genau das selbe Problem und bei mir hat eine Grundreinigung des Rechners völlige Abhilfe geschaffen. Ich hab mir einen Pinsel geschnappt und damit den ganzen Staub der sich im Gerät abgelagert hatte, einfach rausgeschmissen :-)
Der Einzigste ist noch viel einziger als der Einzige!

wlfbck

Trainee

Beiträge: 86

Registrierungsdatum: 1. Oktober 2008

4

Donnerstag, 17. Oktober 2013, 21:50

ich hatte mal genau das selbe Problem und bei mir hat eine Grundreinigung des Rechners völlige Abhilfe geschaffen. Ich hab mir einen Pinsel geschnappt und damit den ganzen Staub der sich im Gerät abgelagert hatte, einfach rausgeschmissen :-)
Das würd ich auch als erstes immer machen. Dauert zwar ne halbe Stunde, ist dafür aber kostenlos ;)

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

5

Freitag, 18. Oktober 2013, 12:41

Speichertest habe ich noch nicht gemacht, nein. Der bei der Xubuntu-Installation mit installierte und über GRUB auswählbare memtest verweigert aufgrund eines zu kleinen unteren Speichers den Start. Muss da mal nach Alternativen schauen.

Gibt's bei den Staubpinseleien etwas, das ich beachten muss? Pinsel-/Borstentyp? Nicht, dass die sich durch die Reibereien statisch aufladen. Werde ich kann auchmal versuchen.

Was mich wundert ist nur das recht konstante zeitliche Verhalten. Bei speicher- oder staubbedingten Fehlerursachen hätte ich mehr Zufälligkeit erwartet.

Rick

Mädchen

  • »Rick« ist männlich

Beiträge: 1 266

Registrierungsdatum: 17. März 2004

Wohnort: ::1/128

Beruf: Forentroll

6

Freitag, 18. Oktober 2013, 12:55

Naja, so Muster werden rein psychologisch immer gesucht, und damit auch gefunden, wenn sie eigentlich gar nicht da sind, insofern darf man da man auf so beobachtete Muster nicht zuviel Gewicht legen, besonders wenn man keine eindeutigen Warnzeichen kurz vor dem Absturz bekommt.

Da du von kernel panics spricht ist die Situation etwas uneindeutiger, da bei Strom/Spannungsproblemen meist das System entweder komplett stehen bleibt, ohne dass eine panic ausgelöst wird, oder prompt ausgeht/neustartet.
Kernel panics sind meistens in defektem Speicher(-interface) oder anderer defekter Hardware zu suchen.

Da du aber hauptsächlich von harten Aufhängern und automatischen Neustartes berichtest, könnten die panics vielleicht auch Artefakte von besonders empfindlicher Hardware sein, die Probleme macht, bevor das System komplett stirbt.

Zum Speichertesten mach dir memtest86+ auf einen USB-stick und boote davon. Wenn das über Nacht keine Fehler findet, dann sollte der Speicher nicht das Problem sein.
Wenn es sich aufhängt, dann ist es definitiv ein Stromversorgungsproblem.

Sometimes you've got to ask yourself: Is xkcd shitty today?

vogelj

Yahniggck Pføgæhl

  • »vogelj« ist männlich

Beiträge: 106

Registrierungsdatum: 11. Oktober 2010

Wohnort: Hannover, Nordstadt

7

Samstag, 19. Oktober 2013, 20:11

Evtl. hast du wieder eine Heizung an die du im Sommer nicht genutzt hast die nahe des Rechners ist?

1. Memtest
2. Temperatur überwachen im Betrieb und simple Tests laufen lassen, dann notieren wie warm der Rechner bei Absturz war und wiederholen
3. CPU aus Socket nehmen und neu einsetzen
4. Anderes Netzteil ausprobieren
5. Dateisystem nochmal manuell komplett checken lassen (Inkl. boot partitionen)
6. Rechner testweise z.B. auf Seite kippen vor betrieb
- Sollte das alles nicht geändert haben oder dir ein Schritt zu aufwendig sein: gründlich Reinigen

Für mich klingt das nach Speicherfehler, dreck zwischen Pins der CPU oder Temperaturproblemen.

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

8

Donnerstag, 24. Oktober 2013, 13:00

So, mal ein kleines Update:
Die letzten Tage ist das Problem nicht aufgetaucht. Geändert habe ich nix. Na ja.

Memtest habe ich mal laufen lassen, nachdem ich eine gepatchte Version gefunden habe, die mit weniger "low memory" auskommt. Nachttest habe ich zwar nicht gemacht (schlafen und so), aber zwischendurch mal mehrere Passes. Keine Fehler oder Abstürze dabei.

Temperaturprobleme kann ich auch ausschließen - zumindest, was die Sensoren mir mitteilen. Keine Heizung in der Nähe, Zimmer kühl. Werte des Temperatursensors lasse ich mir immer anzeigen, bleibt unter 50 °C. Außerdem hängt er sich ja immer recht früh auf, wenn er es denn tut. Unter Last (Zocken o.A.) noch nie passiert.

@vogelj:
CPU neu einsetzen werde ich bei Gelegenheit mal ausprobieren, bin ich im Moment aber zu faul zu. :) Kann das Dateisystem einen Einfluss haben, wenn der Rechner sich bereits im POST aufhängt? Warum Rechner auf der Seite betreiben?

Andere Sache: Kennt jemand einen kleinen Kompressor (mit Tank), den man per Hand betreiben kann? Ganzer Kompressor ist mir zuviel/kein Platz, Druckluft in Dosen erscheint mir sehr ineffizient.

SammysHP

Forenwolf

  • »SammysHP« ist männlich

Beiträge: 697

Registrierungsdatum: 11. Oktober 2010

Wohnort: Celle

Beruf: Student

9

Donnerstag, 24. Oktober 2013, 13:06

Kompressor? Dass du Druckluft zum Ausblasen hast? Per Handbetrieb? Da spielen zwei Faktoren eine Rolle: Volumen und Druck.

Für das Volumen brauchst du einen Tank. Je größer, desto länger kannst du blasen.

Den Druck kannst du z.B. mit einer Dämpferpumpe aufbauen, die schaffen i.d.R. 15-20 bar. Aber selbst für ein 500 ml Tank wirst du einige Zeit pumpen müssen (ob 30 Minuten reichen?).

vogelj

Yahniggck Pføgæhl

  • »vogelj« ist männlich

Beiträge: 106

Registrierungsdatum: 11. Oktober 2010

Wohnort: Hannover, Nordstadt

10

Donnerstag, 24. Oktober 2013, 16:44

Wenn du beim POST schon Probleme hast liegt es eher nicht am Dateisystem, aber spätestens wenn er an den Bootloader übergeben will sollte dein Dateisystem fehlerfrei funktionieren.

Rechner auf Seite weil: Teils lose Kabel einen kurzen erzeugen, sich evtl. ein Bauteil leicht entlötet hat und so anders kontakt hat, Festplatten anders reagieren, usw.
- Ausprobieren kostet ja nichts und sicherlich einfacher als CPU neu zu setzen und Gehäuse komplett zu reinigen.
Einige von den alten Xbox kann man so angeblich schon frühzeitig auf fehlerhafte Kondensatoren testen: Gedreht vergessen sie nämlich auf einmal ihre Einstellung + Systemzeit.

Druckluft in Dosen sind nicht so toll für Elektronik (meiner Erfahrung nach). Bzw. hängt sehr stark von der Qualität ab: Ist relativ teuer und wenn man nicht aufpasst werden die Bauteile extrem kalt oder feucht.

wlfbck

Trainee

Beiträge: 86

Registrierungsdatum: 1. Oktober 2008

11

Donnerstag, 24. Oktober 2013, 16:58

Das mit dem auf die Seite legen würde ich btw tunlichst nicht tun, wegen der Lager. Genauer gesagt geht das zwar, aber dann sollten sie schon immer so gelaufen sein.

Kiki der Gecko

Regenbogeneidechse

Beiträge: 512

Registrierungsdatum: 1. Oktober 2008

12

Donnerstag, 24. Oktober 2013, 21:29

Was mir bei Problemen im POST noch so spontan einfällt: Mal die Smart-Daten der Festplatten auslesen.
"Alles ist eins - außer der Null." - Wau Holland

hamena314

Zerschmetterling

  • »hamena314« ist männlich

Beiträge: 2 032

Registrierungsdatum: 31. August 2003

Wohnort: Hannover

Beruf: Informatikstudent (d'uh)

13

Donnerstag, 24. Oktober 2013, 23:43

Andere Sache: Kennt jemand einen kleinen Kompressor (mit Tank), den man per Hand betreiben kann? Ganzer Kompressor ist mir zuviel/kein Platz, Druckluft in Dosen erscheint mir sehr ineffizient.


Ich benutze dafür nen Blasebalg, den ich mit dem Fuss benutzen kann. Funktioniert recht gut. :)
Übrigens hab' ich mal gehört, dass man Lüfter festhalten sollte, wenn man reinpustet, weil sonst schädliche Ströme induziert werden könnten. Keine Ahnung wie sehr das stimmt, aber ich versuche trotzdem höchst-Drehzahlen beim Sauberpusten zu vermeiden. ;)
Nicht der Wind bestimmt die Richtung, sondern das Segel! (Lao Xiang, China)

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

14

Freitag, 25. Oktober 2013, 13:28

Smart gecheckt, alle Laufwerke ohne geloggte Fehler, Attribute in Ordnung, Selbsttest unauffällig.

Blasebalg ist ne super Idee, danke! :) Werde mir mal einen besorgen und mal eine Tiefensäuberung vornehmen.

Auf die Seite legen: da ich die letzten Tage keine Probleme hatte, müsste ich den Rechner mindestens wenige Wochen "umlegen", um halbwegs aussagekräftige Resultate zu erhalten. Dafür habe ich keinen Platz. :D

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

15

Sonntag, 21. September 2014, 13:22

Ich möchte das Thema hier nochmal fortführen. Meine Probleme waren zeitweise fast verschwunden, bis sie sich verstärkt zurückgemeldet haben. Staubkur hat also nicht geholfen. Ich hatte mich dann dazu entschieden, ein neues Netzteil anzuschaffen. Sah zuerst vielversprechend aus, Probleme sind prinzipiell aber immer noch da, auch wenn seit dem Netzteilwechsel nicht mehr so häufig.

Wenige Male hat mir der Linux-Kernel beim Boot eine Meldung der Form "BUG: soft lockup - cpu #0 stuck for 23s" ausgespuckt. Außerdem konnte ich hin und wieder beobachten, dass die CPU-Auslastung eines Kerns, kurz bevor der Rechner hängen blieb, unerwartet auf 100 & stieg. Als ich dann die Idee hatte, memtest86+ mal zu starten, direkt nachdem der Fehler wieder aufgetreten war, hatte es tatsächlich etwas zu berichten.

Derzeit starte ich memtest direkt nach dem Anschalten des Rechners. Treten in den ersten ~10 Minuten keine Fehler auf, ist alles prima und ich kann arbeiten. Andernfalls lasse ich memtest so lange laufen, bis die Fehlerphase vorbei ist.

Die Ergebnisse, die mir memtest liefert, deuten meines Erachtens auf Fehler beim Datentransfer hin, denn wenn welche auftreten, dann sind es so viele, dass der Zähler in der Regel mehrere Male überläuft (der zählt bis 32767). Zudem sind die Speicheradressen, bei denen Fehler festgestellt werden, nicht konsistent. Bis auf einen Lauf war außerdem immer das LSB fehlerhaft. In einem gesonderten Fall war es Bit 5. Teilweise spuckt memtest auch Merkwürdigkeiten aus - da ist dann die höchste Speicheradresse, bei der Fehler aufgetreten sind, kleiner als die niedrigste. Ich habe mal Bilder gemacht:

http://imgur.com/a/KViAP

In einem anderen Board kann ich den Speicher nicht testen, auch habe ich keinen anderen Speicher da. Rotieren der Speichermodule steht noch auf meinem Plan, habe ich aber noch nicht probiert. Zusammen mit den anderen Symptomen scheint mir, die Spannungsversorgung auf dem Mainboard ist nicht on Ordnung oder ein Speichercontroller der CPU hat eine Macke.

Hat dazu noch jemand Anmerkungen?

tITan

Praktikant

  • »tITan« ist männlich

Beiträge: 29

Registrierungsdatum: 13. April 2014

Beruf: Student

16

Sonntag, 21. September 2014, 13:49

Ich hatte das gleiche Problem mit CPU (Kern) auf 100% vor Absturz bei meinem alten Laptop auch.
Ich gehe mal davon aus, dass dein Rechner häufiger auch mal mit BSOD abstürzt oder "stottert". (?)


Ich konnte das Problem bei mir auch nicht ganz detektieren. Ich bin mir sicher, dass entweder der RAM oder Memory-Controller im CPU defekt ist.
Wobei ich wegen der hohen CPU-Last eher zu letzterem tendiere.
(Mainboard or HDD/SSD kommen nicht in Frage, da die Teile bei mir auch zweimal gewechselt wurden und der Fehler weiterhin auftrat)


Folgendes hilft eventuell, aber auch nicht auf Dauer. Falls dein Prozessor übertaktet ist (kann ich im Bild nicht ablesen ob das der Fall ist), dann solltest du versuchen den OC-Takt runter zu setzen oder ganz auf das OC zu verzichten.
Wenn alles das nicht hilft, hol dir von Bekannten/Freunden mal einen RAM-Riegel, der noch nicht bei dir verbaut war und probier das mal.
Ist der RAM defekt, läuft der Rechner danach wieder einwandfrei. Wenn nicht ist der Memory Controller schrott und du brauchst einen neuen CPU.
Der Computer ist nicht schuld daran, dass das Programm nicht richtig funktioniert, denn er macht nur das, was der Programmierer ihm befohlen hat.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »tITan« (21. September 2014, 13:50)


Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

17

Mittwoch, 24. September 2014, 21:31

Danke, CPU ist und war nicht übertraktet. Werde bei Gelegenheit mal Speichertausch anstreben.

Rick

Mädchen

  • »Rick« ist männlich

Beiträge: 1 266

Registrierungsdatum: 17. März 2004

Wohnort: ::1/128

Beruf: Forentroll

18

Sonntag, 28. September 2014, 18:11

Ich würde eher auf Mainboard oder CPU tippen, bei dem berichteten Verhalten.
Insbesondere der Speichercontroller könnte schuld sein, die Spannungsversorgung des Mainboards, oder es gibt vielleicht sogar irgendwo Isolationsprobleme.

Je nachdem wie alt die Hardware ist, würde ich sie vermutlich aufgeben und ersetzen, es sei denn du hast noch Garantie. In dem Fall ist es aber auch schwer zu isolieren ob es board oder CPU ist. RAM-Probleme könnten es auch sein, aber in der Regel ist RAM relativ langlebig und stabil, bei Referenztaktung.

Sometimes you've got to ask yourself: Is xkcd shitty today?

Nagezahn

Junior Schreiberling

  • »Nagezahn« ist männlich
  • »Nagezahn« ist der Autor dieses Themas

Beiträge: 198

Registrierungsdatum: 9. Februar 2010

Wohnort: Nordstadt

19

Dienstag, 30. September 2014, 20:24

Danke für deine Sicht der Dinge.

Ich habe mich im vorigen Beitrag unklar ausgedrückt. Den Speicher wollte ich nicht durch neuen ersetzen, sondern meine vorhandenen Module miteinander austasuchen. Von Slot 0 in Slot 3 und von Slot 1 in Slot 2, also über Kreuz. Habe ich am Sonntag in die Tat umgesetzt. Merkwürdigerweise hat mir memtest bisher keine Fehler mehr ausgegeben.

Seit vielleicht einer Woche ist mir allerdings noch ein anderes Problem aufgefallen. Es scheint, als ob meine Maus hin und wieder die Verbindung verliert. Für etwa eine Sekunde steht der Zeiger dann still, und so weit ich es beurteilen kann, wird auch kein Status der Tasten mehr übertragen. Z.B. kommt es vor, dass ich beim Scrollen mit Scrollbalken den unterwegs "verliere". Keine Ahnung, ob es an der Maus liegt, oder die USB-Schnittstelle einen Schluckauf hat.

tITan

Praktikant

  • »tITan« ist männlich

Beiträge: 29

Registrierungsdatum: 13. April 2014

Beruf: Student

20

Dienstag, 30. September 2014, 21:28

Seit vielleicht einer Woche ist mir allerdings noch ein anderes Problem aufgefallen. Es scheint, als ob meine Maus hin und wieder die Verbindung verliert. Für etwa eine Sekunde steht der Zeiger dann still, und so weit ich es beurteilen kann, wird auch kein Status der Tasten mehr übertragen. Z.B. kommt es vor, dass ich beim Scrollen mit Scrollbalken den unterwegs "verliere". Keine Ahnung, ob es an der Maus liegt, oder die USB-Schnittstelle einen Schluckauf hat.
Das was du als Schluckauf beschreibst, hatte ich damals auch, ich habe es als "stottern" schon aufgeführt - siehe vorheriger Beitrag.


Habe nochmals gegooglet. Vielleicht liegt es an der Spannung im RAM (zu niedrig?).
Nach google-Recherche sollte man vielleicht mal die Spannung etwas erhöhen oder die Latenzzeiten verändern. Oder Mainboardtrieber/BIOS aktualisieren

Kenne mich da aber überall nicht genauer aus. Müsstest du auf dein eigenes Risiko ausprobieren, ob das hilft.
Der Computer ist nicht schuld daran, dass das Programm nicht richtig funktioniert, denn er macht nur das, was der Programmierer ihm befohlen hat.