Announcement

Collapse
No announcement yet.

Fehler mit MySQl Clusterdatenbank

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Fehler mit MySQl Clusterdatenbank

    Hallo Leute,
    unsere Datenbank macht sich im Moment immer unbeliebter. Seit einigen Wochen haben wir immer wieder folgenden Fehler:
    "Tempor�rer Fehler 4028 'Node failure caused abort of transaction' von NDBCLUSTER".

    Unser Konfiguration:
    2 mal Manager
    2 mal SQL Nodes
    3 mal Datennodes (Multithread 8 Kerne)

    config:
    [ndbd default]
    NoOfReplicas = 3
    DataMemory = 2048M
    IndexMemory = 512M
    DataDir = D:\mysql_data\log # Verzeichnis der Logdateien für NDBD-Knoten
    BackupDataDir = D:\MySQL_Data\ndb_backup

    Ich verstehe das nicht. Eigentlich soll der ndbmtd auf den Datennodes durch einen angel prozess sich immer wieder neustarten. Macht er aber nicht. Und so brechen erst ein Node dann der nächste Node weg
    Zum Glück bleibt wenigstens einer am Leben, so dass wir die Datenbank immer wieder ohne Unterbrechung hoch fahren können. Aber das kann nicht Sinn der Sache sein.
    Hat jemand ein wenig mehr Ahnung von dem MySQL Cluster? Ich könnte wirklich Hilfe gebrauchen.
    Danke Torsten

  • #2
    Ich hab keine Ahnung von den mySQL / Clustern.
    Etwas googlen hilft aber weiter. Wie wärs wenn Du mal die Cluster Log Files durchschaust, hier gibt es sicher detailierte Hinweise.
    Z.B. ein Fall "[MgmtSrvr] ALERT -- Node 4: Node 7 declared dead due to missed heartbeat "
    offenbar ein ethernet adapter Problem.
    http://forums.mysql.com/read.php?25,383537,383537

    Es gibt sicher auch viele andere Möglichkeiten, einen Node zu Fall zu bringen.

    Die Angaben, die Du hier gemacht hast, dürften eh niemand für eine Analyse reichen.
    Gruß, defo

    Comment


    • #3
      Hallo defo, danke für deine schnelle Antwort. Aber ganz so einfach ist es nicht:
      2013-11-10 01:00:54 [ndbd] ALERT -- Node 4: Forced node shutdown completed. Caused by error 2303: 'System error, node killed during node restart by other node(Internal error, programming error or missing error message, please report a bug). Temporary error, restart node'.
      2013-11-10 11:42:56 [ndbd] INFO -- Angel pid: 58024 started child: 53812

      Leider antwortet Oracle / MySQL so gut wie nie. Zumindest beim Cluster.
      Danke Torsten

      Comment


      • #4
        Originally posted by Tossi65 View Post
        Hallo defo, danke für deine schnelle Antwort. Aber ganz so einfach ist es nicht:
        2013-11-10 01:00:54 [ndbd] ALERT -- Node 4: Forced node shutdown completed. Caused by error 2303: 'System error, node killed during node restart by other node(Internal error, programming error or missing error message, please report a bug). Temporary error, restart node'.
        2013-11-10 11:42:56 [ndbd] INFO -- Angel pid: 58024 started child: 53812

        Leider antwortet Oracle / MySQL so gut wie nie. Zumindest beim Cluster.
        Ich hab ja nicht behauptet, dass es einfach ist. Viel Log Info ist das immer noch nicht. Kann man davon ausgehen, dass es alles ist? Oder muss man das alles einzeln erfragen.
        Wenn ich mich richtig erinnere, gab's das Problem doch schon vor ein paar Wochen oder war das bei jemand anders?
        Ich hab da ein paar Fragen gestellt, deren Antwort ich nicht mitbekommen hab.

        "Please report a bug" ist ja auch ziemlich eindeutig. Irgendwann kommt halt der Punkt, wo man vielleicht besser einen Wartungsvertrag hat.
        Egal, ich kann da nicht weiterhelfen.
        Gruß, defo

        Comment


        • #5
          Guten Morgen defo,
          freut mich, dass du dich dieser Sache annimmst. Das ist, was im Log steht. Den dazu gehörigen Dump wollte ich hier nicht reinstellen, da er ziemlich groß ist.
          Den Dump kann, meine ich, auch nur ein Clusterprofi bewerten. Ich habe schon einige Bücher und Foren durch, aber die NDB Engine wird überall nur stiefmütterlich
          angesprochen. Ich habe jetzt ein amerikanisches Buch gefunden, aber da muss ich mich erst einmal rein lesen. Ich kann nur versuchen den Cluster am Leben zu erhalten.
          Natürlich wäre Support schön, aber den bekommt man nur bei der kommerziellen Version. Die war aber unserem Chef schlicht zu teuer und ich bin derjenige im Projekt, der übrig geblieben ist.
          Egal, es muss weiter gehen. Vielleicht finde ich ja noch Hilfe.
          Danke Torsten

          Comment

          Working...
          X