Merge #592: Use trivial algorithm in ecmult_multi if scratch space is small

[secp256k1.git] / src / scalar_4x64_impl.h
diff --git a/src/scalar_4x64_impl.h b/src/scalar_4x64_impl.h

index b1793768d1924589bb2c358cf08af778b948d456..d378335d996f32449a1d782352f91d5c60cac3aa 100644 (file)
--- a/src/scalar_4x64_impl.h
+++ b/src/scalar_4x64_impl.h
@@ -4,8 +4,8 @@
   * file COPYING or http://www.opensource.org/licenses/mit-license.php.*
   **********************************************************************/
  
-#ifndef _SECP256K1_SCALAR_REPR_IMPL_H_
-#define _SECP256K1_SCALAR_REPR_IMPL_H_
+#ifndef SECP256K1_SCALAR_REPR_IMPL_H
+#define SECP256K1_SCALAR_REPR_IMPL_H
  
  /* Limbs of the secp256k1 order. */
  #define SECP256K1_N_0 ((uint64_t)0xBFD25E8CD0364141ULL)
@@ -282,8 +282,8 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "movq 56(%%rsi), %%r14\n"
      /* Initialize r8,r9,r10 */
      "movq 0(%%rsi), %%r8\n"
-    "movq $0, %%r9\n"
-    "movq $0, %%r10\n"
+    "xorq %%r9, %%r9\n"
+    "xorq %%r10, %%r10\n"
      /* (r8,r9) += n0 * c0 */
      "movq %8, %%rax\n"
      "mulq %%r11\n"
@@ -291,7 +291,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq %%rdx, %%r9\n"
      /* extract m0 */
      "movq %%r8, %q0\n"
-    "movq $0, %%r8\n"
+    "xorq %%r8, %%r8\n"
      /* (r9,r10) += l1 */
      "addq 8(%%rsi), %%r9\n"
      "adcq $0, %%r10\n"
@@ -309,7 +309,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq $0, %%r8\n"
      /* extract m1 */
      "movq %%r9, %q1\n"
-    "movq $0, %%r9\n"
+    "xorq %%r9, %%r9\n"
      /* (r10,r8,r9) += l2 */
      "addq 16(%%rsi), %%r10\n"
      "adcq $0, %%r8\n"
@@ -332,7 +332,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq $0, %%r9\n"
      /* extract m2 */
      "movq %%r10, %q2\n"
-    "movq $0, %%r10\n"
+    "xorq %%r10, %%r10\n"
      /* (r8,r9,r10) += l3 */
      "addq 24(%%rsi), %%r8\n"
      "adcq $0, %%r9\n"
@@ -355,7 +355,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq $0, %%r10\n"
      /* extract m3 */
      "movq %%r8, %q3\n"
-    "movq $0, %%r8\n"
+    "xorq %%r8, %%r8\n"
      /* (r9,r10,r8) += n3 * c1 */
      "movq %9, %%rax\n"
      "mulq %%r14\n"
@@ -376,7 +376,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      /* extract m6 */
      "movq %%r8, %q6\n"
      : "=g"(m0), "=g"(m1), "=g"(m2), "=g"(m3), "=g"(m4), "=g"(m5), "=g"(m6)
-    : "S"(l), "n"(SECP256K1_N_C_0), "n"(SECP256K1_N_C_1)
+    : "S"(l), "i"(SECP256K1_N_C_0), "i"(SECP256K1_N_C_1)
      : "rax", "rdx", "r8", "r9", "r10", "r11", "r12", "r13", "r14", "cc");
  
      /* Reduce 385 bits into 258. */
@@ -387,8 +387,8 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "movq %q11, %%r13\n"
      /* Initialize (r8,r9,r10) */
      "movq %q5, %%r8\n"
-    "movq $0, %%r9\n"
-    "movq $0, %%r10\n"
+    "xorq %%r9, %%r9\n"
+    "xorq %%r10, %%r10\n"
      /* (r8,r9) += m4 * c0 */
      "movq %12, %%rax\n"
      "mulq %%r11\n"
@@ -396,7 +396,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq %%rdx, %%r9\n"
      /* extract p0 */
      "movq %%r8, %q0\n"
-    "movq $0, %%r8\n"
+    "xorq %%r8, %%r8\n"
      /* (r9,r10) += m1 */
      "addq %q6, %%r9\n"
      "adcq $0, %%r10\n"
@@ -414,7 +414,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq $0, %%r8\n"
      /* extract p1 */
      "movq %%r9, %q1\n"
-    "movq $0, %%r9\n"
+    "xorq %%r9, %%r9\n"
      /* (r10,r8,r9) += m2 */
      "addq %q7, %%r10\n"
      "adcq $0, %%r8\n"
@@ -455,7 +455,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      /* extract p4 */
      "movq %%r9, %q4\n"
      : "=&g"(p0), "=&g"(p1), "=&g"(p2), "=g"(p3), "=g"(p4)
-    : "g"(m0), "g"(m1), "g"(m2), "g"(m3), "g"(m4), "g"(m5), "g"(m6), "n"(SECP256K1_N_C_0), "n"(SECP256K1_N_C_1)
+    : "g"(m0), "g"(m1), "g"(m2), "g"(m3), "g"(m4), "g"(m5), "g"(m6), "i"(SECP256K1_N_C_0), "i"(SECP256K1_N_C_1)
      : "rax", "rdx", "r8", "r9", "r10", "r11", "r12", "r13", "cc");
  
      /* Reduce 258 bits into 256. */
@@ -472,7 +472,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "movq %%rax, 0(%q6)\n"
      /* Move to (r8,r9) */
      "movq %%rdx, %%r8\n"
-    "movq $0, %%r9\n"
+    "xorq %%r9, %%r9\n"
      /* (r8,r9) += p1 */
      "addq %q2, %%r8\n"
      "adcq $0, %%r9\n"
@@ -483,7 +483,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq %%rdx, %%r9\n"
      /* Extract r1 */
      "movq %%r8, 8(%q6)\n"
-    "movq $0, %%r8\n"
+    "xorq %%r8, %%r8\n"
      /* (r9,r8) += p4 */
      "addq %%r10, %%r9\n"
      "adcq $0, %%r8\n"
@@ -492,7 +492,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      "adcq $0, %%r8\n"
      /* Extract r2 */
      "movq %%r9, 16(%q6)\n"
-    "movq $0, %%r9\n"
+    "xorq %%r9, %%r9\n"
      /* (r8,r9) += p3 */
      "addq %q4, %%r8\n"
      "adcq $0, %%r9\n"
@@ -501,7 +501,7 @@ static void secp256k1_scalar_reduce_512(secp256k1_scalar *r, const uint64_t *l)
      /* Extract c */
      "movq %%r9, %q0\n"
      : "=g"(c)
-    : "g"(p0), "g"(p1), "g"(p2), "g"(p3), "g"(p4), "D"(r), "n"(SECP256K1_N_C_0), "n"(SECP256K1_N_C_1)
+    : "g"(p0), "g"(p1), "g"(p2), "g"(p3), "g"(p4), "D"(r), "i"(SECP256K1_N_C_0), "i"(SECP256K1_N_C_1)
      : "rax", "rdx", "r8", "r9", "r10", "cc", "memory");
  #else
      uint128_t c;
@@ -738,7 +738,7 @@ static void secp256k1_scalar_mul_512(uint64_t l[8], const secp256k1_scalar *a, c
      extract(l[5]);
      muladd_fast(a->d[3], b->d[3]);
      extract_fast(l[6]);
-    VERIFY_CHECK(c1 <= 0);
+    VERIFY_CHECK(c1 == 0);
      l[7] = c0;
  #endif
  }
@@ -912,6 +912,7 @@ static void secp256k1_scalar_sqr(secp256k1_scalar *r, const secp256k1_scalar *a)
      secp256k1_scalar_reduce_512(r, l);
  }
  
+#ifdef USE_ENDOMORPHISM
  static void secp256k1_scalar_split_128(secp256k1_scalar *r1, secp256k1_scalar *r2, const secp256k1_scalar *a) {
      r1->d[0] = a->d[0];
      r1->d[1] = a->d[1];
@@ -922,6 +923,7 @@ static void secp256k1_scalar_split_128(secp256k1_scalar *r1, secp256k1_scalar *r
      r2->d[2] = 0;
      r2->d[3] = 0;
  }
+#endif
  
  SECP256K1_INLINE static int secp256k1_scalar_eq(const secp256k1_scalar *a, const secp256k1_scalar *b) {
      return ((a->d[0] ^ b->d[0]) | (a->d[1] ^ b->d[1]) | (a->d[2] ^ b->d[2]) | (a->d[3] ^ b->d[3])) == 0;
@@ -944,4 +946,4 @@ SECP256K1_INLINE static void secp256k1_scalar_mul_shift_var(secp256k1_scalar *r,
      secp256k1_scalar_cadd_bit(r, 0, (l[(shift - 1) >> 6] >> ((shift - 1) & 0x3f)) & 1);
  }
  
-#endif
+#endif /* SECP256K1_SCALAR_REPR_IMPL_H */