Announcement

**Torsten Grundke** · 16.10.2003, 09:21

Hallo Constantinus,

ich schau mir das mal heute Abend an.

Tsch��

Torste

**Robert Marquardt** · 16.10.2003, 09:23

Wenn du auch mit Floating Points und Logarithmus rumrechnest ist die Laufzeit kein Wunder. 
Mach dir doch eine Tabelle von 256 Elementen in der drinsteht wieviele Bits das entsprechende Byte gesetzt hat. Damit kriegst du die Bitanzahl mit einem Zugriff "Bitanzahl[TestByte]"

**Constantinus van der Kruijs** · 16.10.2003, 09:41

@Robert Marquardt

Die operationen mit den Floats sind meiner ansicht nach unkritisch, da sie die cpu gut verarbeiten kann - versuche haben das auch gezeigt. Aber man kann das sicherlich performanter und etwas eleganter l�sen, da stimme ich dir zu.

> Was meinst du mit dieser tabelle? Und inwiefern kann mir die anzahl der gesetzten bits weiterhelfen

**Robert Marquardt** · 16.10.2003, 11:09

Die Differenzmaske sagt dir welche Bits in den beiden Bytes unterschiedlich sind. Du willst ja nur etwas machen wenn genau ein Bit unterschiedlich ist, also AnzahlBits[Differenzmaske] = 1. 
<pre>
const
AnzahlBits: array [0..255] of Integer =
(
0, 1, 1, 2, // alle Werte rechne ich jetzt nicht aus
);
</pre&gt

**Constantinus van der Kruijs** · 16.10.2003, 11:30

hmm. warum hat dieses array bei dir 256 elemente? ich habe doch 600.000 byte-masken, die ich vergleichen will... das array m�sste dann doch 600.000^2 elemente haben, damit ich f�r jede differenzmaske die anzahl bits speichern kann. Ausserdem m�sste ich die anzahl der bits ja auch noch irgendwie ermitteln - die byte-masken sind nicht vorher bekannt. Verstehe ich dich irgendwie falsch

**Torsten Grundke** · 16.10.2003, 11:59

Hallo Constantinus,

mit dem Array AnzahlBits hat man eine elegante M�glichkeit die Anzahl der notwendigen Bitvergleiche stark zu reduzieren.

z.B. wird die Zahl 8 durch ein gesetztes Bit dargestellt. Die 13 ben�tigt 3 Bit's. Daraus ergibt sich das ich nicht erst den Bitvergleich starten mu�, weil ja mindestens 2 Bits unterschiedlich sind.

Gru�

Torste

**Robert Marquardt** · 16.10.2003, 12:05

Das Array a ist fuer deinen Test voellig unerheblich, da ja das Hilfsarray s die Information 0 bzw nicht 0 fuer die 2 Bytes traegt. 
Jedes gesetzte Bit der Hilfsmaske d besagt das sich das entsprechende Byte des einen Eintrags von dem des anderen Eintrags unterscheidet. Konsequenterweise muss eines der beiden Bytes 0 sein. 
Jetzt willst du wissen ob genau ein Unterschied vorhanden ist. Du musst also die Bits in d zaehlen. 
Hier habe ich mich geirrt, da ich die Bits in einem Byte zaehlen wollte. Dafuer taugt AnzahlBits aber auch. Einfach die Bytes von d extrahieren und die jeweilige Anzahl Bits zusammenzaehlen. 
BTW Cardinal ist besser als Integer fuer die Variablen s, d usw

**Torsten Grundke** · 16.10.2003, 12:41

Hallo Robert,

vielleicht bin ich ja etwas begriffsstutzig, aber ich versteht nicht wie Du das Bitarray verwenden willst.

So wie ich Dich verstanden habe, ist in dem Array definiert wieviel Bits zur Darstellung der jeweiligen Zahl ben�tigt werden.

Du ermittels die Anzahl der Bits f�r beide Zahlen und errechnest die Differenz. Mit der erhaltenen Differenz liegt meiner Meinung nach noch kein endg�ltiges Ergebnis vor.

z.B. die Zahl 13 ben�tigt 3 Bit, die Zahl 131 ben�tigt ebenfalls 3 Bit, aber es sind im Bin�rvergleich 4 Bit's unterschiedlich.

Gru�

Torste

**Constantinus van der Kruijs** · 16.10.2003, 14:33

Ich habe den eindruck, ihr verlauft euch ein bissl, daher versuche ich nochmal die anforderungen an den test zu formulieren:

ich habe ein array a vorliegen, in dem 600.000 byte-arrays abgelegt sind. Die 600.000 arrays bestehen aus je 32 byte.

f�r jedes element e1 des array a m�ssen alle anderen elemente e2 gefunden werden, die folgende bedingung erf�llen:
- e1 und e2 unterscheiden sich an einer stelle in ihrem byte-array
- an dieser stelle muss entweder e1 oder e2 ein 0-byte stehen haben
- alle sonstigen stellen m�ssen identisch sein

das hilfsarray s habe ich eingef�hrt um geschickt pr�fen zu k�nnen, ob sich die zwei kandidaten an mehr als zwei positionen unterscheiden (siehe log2-funktion).
es ist prinzipiell �berfl�ssig - man kann diese pr�fung auch am ausgangsarray a vollziehen

**Hagen Reddmann** · 16.10.2003, 14:47

Die Arrays e1 und e2 bestehen aus 32 Bytes, bei denen jedes Byte entweder 0 oder 1 sein kann ? Warum werden diese Arrays nicht durch 32Bit Cardinals ersetzt, und dann reicht BitCount(e1 xor e2) = 1 aus. Damit wird durch einen einzigsten Zugriff auf 4 Bytes = Cardinal in einem Zuge 32 Zust�nde gepr�ft. F�r BitCount(x) kann ich dir eine sehr effiziente Funktion geben.

Gru� Hage

**Constantinus van der Kruijs** · 16.10.2003, 14:57

@hagen:
nein, die arrays e1 und e2 enthalten byte-werte, jeweils irgendetwas zwischen 0 und 255.
wenn es nur boolsche werte w�ren h�tte ich ja gar kein problem, mit dem ich euch hier bel�stigen m�sste.
scheint so, dass das hilfarray s hier verwirrung stiftet: dieses enth�lt eine projektion des byte-arrays mit jeweils einer 1 an den stellen, an denen der wert im byte-array ungleich 0 ist

**Hagen Reddmann** · 16.10.2003, 15:13

Warum du das Hilfsarray S �berhaupt ben�tigst weis ich nicht so recht, da die normalen 32 Byte Arrays ausreichen. Um eine Schleife kommst du aber nicht rum.

<pre>
C := 0;
for I := 0 to 31 do
if (A[I] = 0) and (B[I] <> 0) then Inc(C) else
if (A[I] <> 0) and (B[I] = 0) then Inc(C);
</pre>

C sollte dann 1 sein in deinem Falle.
Du kannst nun diese Schleife durch cleveren Assembler beschleunigen. Es sollte m�glich sein die 32 Byte arrays als 8 Cardinals anzusprechen und diese durch Unrolling ohne Loop zu vergleichen.

Allerdings, nach deiner Aussage willst du ALLE 32 Byte Arrays untereinander mit ALLEN anderen 32 byte arrays vergleichen !? Richtig ? das ist ein enormer Aufwand und sollte durch bessere Algorithmen erledigt werden.

Ich w�rde zB. als erstes alle 32 Byte Arrays in 32Bit Cardinals umwandeln. Dann wird dieses eindimensionale Cardinal array sortiert. Somit findest du alle Werte die identisch zueinander sind, und diese m�ssen dann nur einmalig mit ihrem Wert mit den anderen unterschiedlichen Werten verglichen werden. Als Vergleichoperator k�me dann BitCount(A xor B) zur Anwendung. Die innere Schleife w�re damit wegoptimiert und durch hochoptimierte Algos. ersetzt.

Vielleicht w�re es besser wenn du uns den Algorithums als ganzes erkl�ren w�rdest, und wozu er eigentlich dient. Meistens kann man an h�herer "Denk"-Stelle ansetzen und deine Datenstrukturen daraufhin besser optimieren. Dadurch w�re es zB. m�glich das du garnicht mehr solche Vergleiche machen musst.

Gru� Hage

**Hagen Reddmann** · 16.10.2003, 15:23

z.b. w�rde man bei der Erzeugung deiner Array Struktur statt mit Arrays mit Tries (bin�ren B�umen arbeiten). Alle Arrays mit 0 im ersten Element w�rden dann sofort sortiert in diesen Trie eingef�gt, usw. usw. Nun sind im Trie alle 32 Byte arrays mit erstem element 0 im selben Zweig des Tries. Auf Grund diesem Wissens weisst du sofort das alle Arrays mit einer f�hrenden Null sich zu allen anderen Arrays mit nur einer Null sich um 2 Stellen unterscheiden. Sie m�ssen also �berhaupt nicht mehr �berpr�ft werden. usw. usw.

Eine andere M�glichkeit w�re ein Wechsel in der Darstellung der Arrays. Statt die reinen Daten zu speichern, w�rde man zu jedem Array nur eine Liste der Indexe an denen eine Null vorkommt speichern. Diese Liste w�rde dann sortiert. Die Vergleichoperation beschr�nkt sich nun darauf diese Indexarrays zu �berpr�fen. Dabei kann man enorm viele Operationen durch logischen Ausschlu� effizient programmieren.
Zb. zwei solcher Index Listen k�nnen um 1 unterschiedlich sein wenn sie in der Anzahl der Nullen ebenfalls um 1 differieren.
Alle Indexlisten mit gleicher oder gerader unterschiedlicher Anzahl k�nnen nicht mehr um eine Null unterschiedlich sein.

Gru� Hage

**Constantinus van der Kruijs** · 16.10.2003, 15:25

Allerdings, nach deiner Aussage willst du ALLE 32 Byte Arrays untereinander mit ALLEN anderen 32 byte arrays vergleichen !? Richtig ? das ist ein enormer Aufwand und sollte durch bessere Algorithmen erledigt werden.
 
wir kommen der sache n�her sehe ich. nach besseren algorithmen bin auch auf der suche.
 
es geht um folgendes: diese 600.000 array dienen der eindeutigen identifizierung. jede stelle in dem 32 byte-array ist ein schl�ssel und dessen wert ist sozusagen eine id. wenn ein element identisch zu einem anderen element ist, mit der ausnahme, das eine eine id<>0 auf einem schl�ssel hat, auf dem der andere eine id=0 tr�gt, so ist dieses element dem anderen direkt untergeordnet. welche elemente also einem bestimmten element direkt untergeordnet sind m�chte ich herausfinden .
 
eine vorausgehende sortierung hat auch stattgefunden: von links nach rechts sind die elemente nach ihren ids aufsteigend sortiert.
 
der ansatz, die anzahl an vergleichen zu reduzieren gef�llt mir. doch kann man nicht die information der bytes in 32bit wiedergeben, die bei den vergleichen notwendig ist.
 
die anforderung lautet ja u.a. das die elemente e1 und e2 abgesehen von einer stelle identisch sein m�ssen - also alle anderen bytes m�ssen den gleichen wert haben

Announcement

Anwenden von logischen (bitweise) Operatoren -Jetzt aber Byte-weise

Anwenden von logischen (bitweise) Operatoren -Jetzt aber Byte-weise

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment