Announcement

Collapse
No announcement yet.

Clusterdatenbank

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Clusterdatenbank

    Guten Morgen,
    ich habe mal wieder ein Cluster Problem: Der Cluster besteht aus 2 Managment, 2 SQl umd 3 Datennodes. In letzter Zeit fallen der Reihe nach die Datennodes aus. In den Log steht dann folgendes:
    2013-10-09 04:12:25 [ndbd] ALERT -- Node 3: Forced node shutdown completed. Caused by error 2315: 'Node declared dead. See error log for details(Arbitration error). Temporary error, restart node'.

    Die Node wird dann auch nicht neugestartet durch den Angel Process.

    Kurz vorher meldet eine Anwendung:
    Beim Warten auf eine Sperre wurde die zul�ssige Wartezeit �berschritten. Bitte versuchen Sie, die Transaktion neu zu starten
    SQL: select ordat_sequence, record_type, data_string, time_created, rec_state, time_processed from eledb.ordat where (rec_state = 'BEARBEITET') or (rec_state = 'PROCESSED') order by ordat_sequence limit 500

    Jetzt stellt sich die Frage: Was soll das nun genau heissen? Die Datenverbindung steht auf AutoCommit und wir machen so gut wie keine Joins in den Abfragen.
    Wie kann ich die Transaktionsliste sehen und wie kann ich das beheben?
    Wir haben einige Tabellen, die über eine Million einträge haben. Hat MySql damit Probleme???

    Danke Torsten
    Danke Torsten

  • #2
    Ich hab von mySQL wenig und Cluster gar keine Ahnung, aber:
    Das Select Statement selbst sperrt ja nichts. Es muss ein übergeordnete TR geben, die das anfordert.
    1 Mio Datensätze spielen hier wohl nicht die Hauptrolle, da Ihr ein Cluster wohl nicht aus Spaß benutzt, habt Ihr vermutlich eine hohe Zugriffszahl.
    Es kann natürlich sein, dass die spezifische Anweisung, die Du gepostet hast, problematisch ist, zumindest eben bei hoher Zugriffszahl.
    Die Selektivität von "processed"/"bearbeitet" ist vermutlich nicht sehr groß, vielleicht 1/3, 1/4 der Datensätze? Das limit macht zwar eine Einschränkung, das Order by läuft aber vermutlich auf ein kompletten Aufbau der Datenmenge hinaus.

    Es wäre zu prüfen, ob sich Zugriffszahlen oder eine der Anwendungen geändert haben und ob das mit der Fehlerhäufung zeitlich zusammengeht.
    Ob man die Transaktionen sehen kann, weiß / glaub ich nicht. Wenn es so wäre, ist sie wahrscheinlich eh im Moment des Todes futsch.
    Gruß, defo

    Comment

    Working...
    X