Code coverage tests

This page documents the degree to which the PARI/GP source code is tested by our public test suite, distributed with the source distribution in directory src/test/. This is measured by the gcov utility; we then process gcov output using the lcov frond-end.

We test a few variants depending on Configure flags on the pari.math.u-bordeaux.fr machine (x86_64 architecture), and agregate them in the final report:

The target is to exceed 90% coverage for all mathematical modules (given that branches depending on DEBUGLEVEL or DEBUGMEM are not covered). This script is run to produce the results below.

LCOV - code coverage report
Current view: top level - kernel/gmp - mp.c (source / functions) Hit Total Coverage
Test: PARI/GP v2.18.0 lcov report (development 29625-116555e390) Lines: 683 719 95.0 %
Date: 2024-10-09 09:06:29 Functions: 54 56 96.4 %
Legend: Lines: hit not hit

          Line data    Source code
       1             : #line 2 "../src/kernel/gmp/mp.c"
       2             : /* Copyright (C) 2002-2003  The PARI group.
       3             : 
       4             : This file is part of the PARI/GP package.
       5             : 
       6             : PARI/GP is free software; you can redistribute it and/or modify it under the
       7             : terms of the GNU General Public License as published by the Free Software
       8             : Foundation; either version 2 of the License, or (at your option) any later
       9             : version. It is distributed in the hope that it will be useful, but WITHOUT
      10             : ANY WARRANTY WHATSOEVER.
      11             : 
      12             : Check the License for details. You should have received a copy of it, along
      13             : with the package; see the file 'COPYING'. If not, write to the Free Software
      14             : Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA. */
      15             : 
      16             : /***********************************************************************/
      17             : /**                                                                   **/
      18             : /**                               GMP KERNEL                          **/
      19             : /** BA2002Sep24                                                       **/
      20             : /***********************************************************************/
      21             : /* GMP t_INT as just like normal t_INT, just the mantissa is the other way
      22             :  * round
      23             :  *
      24             :  *   `How would you like to live in Looking-glass House, Kitty?  I
      25             :  *   wonder if they'd give you milk in there?  Perhaps Looking-glass
      26             :  *   milk isn't good to drink--But oh, Kitty! now we come to the
      27             :  *   passage.  You can just see a little PEEP of the passage in
      28             :  *   Looking-glass House, if you leave the door of our drawing-room
      29             :  *   wide open:  and it's very like our passage as far as you can see,
      30             :  *   only you know it may be quite different on beyond.  Oh, Kitty!
      31             :  *   how nice it would be if we could only get through into Looking-
      32             :  *   glass House!  I'm sure it's got, oh! such beautiful things in it!
      33             :  *
      34             :  *  Through the Looking Glass,  Lewis Carrol
      35             :  *
      36             :  *  (pityful attempt to beat GN code/comments rate)
      37             :  *  */
      38             : 
      39             : #include <gmp.h>
      40             : #include "pari.h"
      41             : #include "paripriv.h"
      42             : #include "../src/kernel/none/tune-gen.h"
      43             : 
      44             : /*We need PARI invmod renamed to invmod_pari*/
      45             : #define INVMOD_PARI
      46             : 
      47           0 : static void *pari_gmp_realloc(void *ptr, size_t old_size, size_t new_size) {
      48           0 :   (void)old_size; return (void *) pari_realloc(ptr,new_size);
      49             : }
      50             : 
      51     1734933 : static void pari_gmp_free(void *ptr, size_t old_size){
      52     1734933 :   (void)old_size; pari_free(ptr);
      53     1734933 : }
      54             : 
      55             : static void *(*old_gmp_malloc)(size_t new_size);
      56             : static void *(*old_gmp_realloc)(void *ptr, size_t old_size, size_t new_size);
      57             : static void (*old_gmp_free)(void *ptr, size_t old_size);
      58             : 
      59             : void
      60        1084 : pari_kernel_init(void)
      61             : {
      62        1084 :   mp_get_memory_functions (&old_gmp_malloc, &old_gmp_realloc, &old_gmp_free);
      63        1084 :   mp_set_memory_functions((void *(*)(size_t)) pari_malloc, pari_gmp_realloc, pari_gmp_free);
      64        1084 : }
      65             : 
      66             : const char *
      67           4 : pari_kernel_version(void)
      68             : {
      69             : #ifdef gmp_version
      70           4 :   return gmp_version;
      71             : #else
      72             :   return "";
      73             : #endif
      74             : }
      75             : 
      76             : void
      77        1076 : pari_kernel_close(void)
      78             : {
      79             :   void *(*new_gmp_malloc)(size_t new_size);
      80             :   void *(*new_gmp_realloc)(void *ptr, size_t old_size, size_t new_size);
      81             :   void (*new_gmp_free)(void *ptr, size_t old_size);
      82        1076 :   mp_get_memory_functions (&new_gmp_malloc, &new_gmp_realloc, &new_gmp_free);
      83        1076 :   if (new_gmp_malloc==pari_malloc) new_gmp_malloc = old_gmp_malloc;
      84        1076 :   if (new_gmp_realloc==pari_gmp_realloc) new_gmp_realloc = old_gmp_realloc;
      85        1076 :   if (new_gmp_free==pari_gmp_free) new_gmp_free = old_gmp_free;
      86        1076 :   mp_set_memory_functions(new_gmp_malloc, new_gmp_realloc, new_gmp_free);
      87        1076 : }
      88             : 
      89             : #define LIMBS(x)  ((mp_limb_t *)((x)+2))
      90             : #define NLIMBS(x) (lgefint(x)-2)
      91             : /*This one is for t_REALs to emphasize they are not t_INTs*/
      92             : #define RLIMBS(x)  ((mp_limb_t *)((x)+2))
      93             : #define RNLIMBS(x) (lg(x)-2)
      94             : 
      95             : INLINE void
      96     6868047 : xmpn_copy(mp_limb_t *x, mp_limb_t *y, long n)
      97             : {
      98    56256356 :   while (--n >= 0) x[n]=y[n];
      99     6868047 : }
     100             : 
     101             : INLINE void
     102   581314543 : xmpn_mirror(mp_limb_t *x, long n)
     103             : {
     104             :   long i;
     105  3847475855 :   for(i=0;i<(n>>1);i++)
     106             :   {
     107  3266161312 :     ulong m=x[i];
     108  3266161312 :     x[i]=x[n-1-i];
     109  3266161312 :     x[n-1-i]=m;
     110             :   }
     111   581314543 : }
     112             : 
     113             : INLINE void
     114   710693835 : xmpn_mirrorcopy(mp_limb_t *z, mp_limb_t *x, long n)
     115             : {
     116             :   long i;
     117  9765273791 :   for(i=0;i<n;i++)
     118  9054579956 :     z[i]=x[n-1-i];
     119   710693835 : }
     120             : 
     121             : INLINE void
     122   235270331 : xmpn_zero(mp_ptr x, mp_size_t n)
     123             : {
     124  2051759680 :   while (--n >= 0) x[n]=0;
     125   235270331 : }
     126             : 
     127             : INLINE GEN
     128    40734185 : icopy_ef(GEN x, long l)
     129             : {
     130    40734185 :   long lx = lgefint(x);
     131    40734185 :   const GEN y = cgeti(l);
     132             : 
     133   289058997 :   while (--lx > 0) y[lx]=x[lx];
     134    40732573 :   return y;
     135             : }
     136             : 
     137             : /* NOTE: arguments of "spec" routines (muliispec, addiispec, etc.) aren't
     138             :  * GENs but pairs (long *a, long na) representing a list of digits (in basis
     139             :  * BITS_IN_LONG) : a[0], ..., a[na-1]. [ In ordre to facilitate splitting: no
     140             :  * need to reintroduce codewords ]
     141             :  * Use speci(a,na) to visualize the corresponding GEN.
     142             :  */
     143             : 
     144             : /***********************************************************************/
     145             : /**                                                                   **/
     146             : /**                     ADDITION / SUBTRACTION                        **/
     147             : /**                                                                   **/
     148             : /***********************************************************************/
     149             : 
     150             : GEN
     151     2996979 : setloop(GEN a)
     152             : {
     153     2996979 :   pari_sp av = avma - 2 * sizeof(long);
     154     2996979 :   (void)cgetg(lgefint(a) + 3, t_VECSMALL);
     155     2996979 :   return icopy_avma(a, av); /* two cells of extra space after a */
     156             : }
     157             : 
     158             : /* we had a = setloop(?), then some incloops. Reset a to b */
     159             : GEN
     160      174328 : resetloop(GEN a, GEN b) {
     161      174328 :   a[0] = evaltyp(t_INT) | evallg(lgefint(b));
     162      174328 :   affii(b, a); return a;
     163             : }
     164             : 
     165             : /* assume a > 0, initialized by setloop. Do a++ */
     166             : static GEN
     167    99453816 : incpos(GEN a)
     168             : {
     169    99453816 :   long i, l = lgefint(a);
     170    99453821 :   for (i=2; i<l; i++)
     171    99456075 :     if (++uel(a,i)) return a;
     172           3 :   a[l] = 1; l++;
     173           3 :   a[0]=evaltyp(t_INT) | _evallg(l);
     174           3 :   a[1]=evalsigne(1) | evallgefint(l);
     175           3 :   return a;
     176             : }
     177             : 
     178             : /* assume a < 0, initialized by setloop. Do a++ */
     179             : static GEN
     180       66652 : incneg(GEN a)
     181             : {
     182       66652 :   long i, l = lgefint(a)-1;
     183       66652 :   if (uel(a,2)--)
     184             :   {
     185       66648 :     if (!a[l]) /* implies l = 2 */
     186             :     {
     187        1976 :       a[0] = evaltyp(t_INT) | _evallg(2);
     188        1976 :       a[1] = evalsigne(0) | evallgefint(2);
     189             :     }
     190       66648 :     return a;
     191             :   }
     192           5 :   for (i=3; i<=l; i++)
     193           5 :     if (uel(a,i)--) break;
     194           4 :   if (!a[l])
     195             :   {
     196           4 :     a[0] = evaltyp(t_INT) | _evallg(l);
     197           4 :     a[1] = evalsigne(-1) | evallgefint(l);
     198             :   }
     199           4 :   return a;
     200             : }
     201             : 
     202             : /* assume a initialized by setloop. Do a++ */
     203             : GEN
     204    99858204 : incloop(GEN a)
     205             : {
     206    99858204 :   switch(signe(a))
     207             :   {
     208      336504 :     case 0:
     209      336504 :       a[0]=evaltyp(t_INT) | _evallg(3);
     210      336504 :       a[1]=evalsigne(1) | evallgefint(3);
     211      336504 :       a[2]=1; return a;
     212       66652 :     case -1: return incneg(a);
     213    99455048 :     default: return incpos(a);
     214             :   }
     215             : }
     216             : 
     217             : INLINE GEN
     218  2545272625 : adduispec(ulong s, GEN x, long nx)
     219             : {
     220             :   GEN  zd;
     221             :   long lz;
     222             : 
     223  2545272625 :   if (nx == 1) return adduu(uel(x,0), s);
     224   714111161 :   lz = nx+3; zd = cgeti(lz);
     225   717030759 :   if (mpn_add_1(LIMBS(zd),(mp_limb_t *)x,nx,s))
     226     5008968 :     zd[lz-1]=1;
     227             :   else
     228   712022776 :     lz--;
     229   717031744 :   zd[1] = evalsigne(1) | evallgefint(lz);
     230   717031744 :   return zd;
     231             : }
     232             : 
     233             : GEN
     234   580520743 : adduispec_offset(ulong s, GEN x, long offset, long nx)
     235             : {
     236   580520743 :   GEN xd=x+2+offset;
     237   806120639 :   while (nx && *(xd+nx-1)==0) nx--;
     238   580520743 :   if (!nx) return utoi(s);
     239   535850139 :   return adduispec(s,xd,nx);
     240             : }
     241             : 
     242             : INLINE GEN
     243  3218347118 : addiispec(GEN x, GEN y, long nx, long ny)
     244             : {
     245             :   GEN zd;
     246             :   long lz;
     247             : 
     248  3218347118 :   if (nx < ny) swapspec(x,y, nx,ny);
     249  3218347118 :   if (ny == 1) return adduispec(*y,x,nx);
     250  1298716562 :   lz = nx+3; zd = cgeti(lz);
     251             : 
     252  1298930694 :   if (mpn_add(LIMBS(zd),(mp_limb_t *)x,nx,(mp_limb_t *)y,ny))
     253    27949920 :     zd[lz-1]=1;
     254             :   else
     255  1271372941 :     lz--;
     256             : 
     257  1299322861 :   zd[1] = evalsigne(1) | evallgefint(lz);
     258  1299322861 :   return zd;
     259             : }
     260             : 
     261             : /* assume x >= y */
     262             : INLINE GEN
     263  1685468010 : subiuspec(GEN x, ulong s, long nx)
     264             : {
     265             :   GEN zd;
     266             :   long lz;
     267             : 
     268  1685468010 :   if (nx == 1) return utoi(x[0] - s);
     269             : 
     270   239788177 :   lz = nx + 2; zd = cgeti(lz);
     271   240229677 :   mpn_sub_1 (LIMBS(zd), (mp_limb_t *)x, nx, s);
     272   240230155 :   if (! zd[lz - 1]) { --lz; }
     273             : 
     274   240230155 :   zd[1] = evalsigne(1) | evallgefint(lz);
     275   240230155 :   return zd;
     276             : }
     277             : 
     278             : /* assume x > y */
     279             : INLINE GEN
     280  2908264049 : subiispec(GEN x, GEN y, long nx, long ny)
     281             : {
     282             :   GEN zd;
     283             :   long lz;
     284  2908264049 :   if (ny==1) return subiuspec(x,*y,nx);
     285  1252497965 :   lz = nx+2; zd = cgeti(lz);
     286             : 
     287  1250329343 :   mpn_sub (LIMBS(zd), (mp_limb_t *)x, nx, (mp_limb_t *)y, ny);
     288  1718753375 :   while (lz >= 3 && zd[lz - 1] == 0) { lz--; }
     289             : 
     290  1250510758 :   zd[1] = evalsigne(1) | evallgefint(lz);
     291  1250510758 :   return zd;
     292             : }
     293             : 
     294             : static void
     295   519724431 : roundr_up_ip(GEN x, long l)
     296             : {
     297   519724431 :   long i = l;
     298             :   for(;;)
     299             :   {
     300   521500344 :     if (++((ulong*)x)[--i]) break;
     301     2162075 :     if (i == 2) { x[2] = HIGHBIT; shiftr_inplace(x, 1); break; }
     302             :   }
     303   519773023 : }
     304             : 
     305             : void
     306   398845756 : affir(GEN x, GEN y)
     307             : {
     308   398845756 :   const long s = signe(x), ly = lg(y);
     309             :   long lx, sh, i;
     310             : 
     311   398845756 :   if (!s)
     312             :   {
     313    40992697 :     y[1] = evalexpo(-bit_accuracy(ly));
     314    40989236 :     return;
     315             :   }
     316   357853059 :   lx = lgefint(x); sh = bfffo(*int_MSW(x));
     317   357853059 :   y[1] = evalsigne(s) | evalexpo(bit_accuracy(lx)-sh-1);
     318   358075650 :   if (sh) {
     319   350593080 :     if (lx <= ly)
     320             :     {
     321   950828630 :       for (i=lx; i<ly; i++) y[i]=0;
     322   246915518 :       mpn_lshift(LIMBS(y),LIMBS(x),lx-2,sh);
     323   247031901 :       xmpn_mirror(LIMBS(y),lx-2);
     324   247406458 :       return;
     325             :     }
     326   103677562 :     mpn_lshift(LIMBS(y),LIMBS(x)+lx-ly,ly-2,sh);
     327   103678626 :     uel(y,2) |= uel(x,lx-ly+1) >> (BITS_IN_LONG-sh);
     328   103678626 :     xmpn_mirror(LIMBS(y),ly-2);
     329             :     /* lx > ly: round properly */
     330   103679514 :     if ((uel(x,lx-ly+1)<<sh) & HIGHBIT) roundr_up_ip(y, ly);
     331             :   }
     332             :   else {
     333     7482570 :     GEN xd=int_MSW(x);
     334     7482570 :     if (lx <= ly)
     335             :     {
     336     9358487 :       for (i=2; i<lx; i++,xd=int_precW(xd)) y[i]=*xd;
     337     5100846 :       for (   ; i<ly; i++) y[i]=0;
     338     2344359 :       return;
     339             :     }
     340    14614027 :     for (i=2; i<ly; i++,xd=int_precW(xd)) y[i]=*xd;
     341             :     /* lx > ly: round properly */
     342     5138211 :     if (uel(x,lx-ly+1) & HIGHBIT) roundr_up_ip(y, ly);
     343             :   }
     344             : }
     345             : 
     346             : INLINE GEN
     347   697963634 : shiftispec(GEN x, long nx, long n)
     348             : {
     349             :   long ny,m;
     350             :   GEN yd, y;
     351             : 
     352   697963634 :   if (!n) return icopyspec(x, nx);
     353             : 
     354   669205067 :   if (n > 0)
     355             :   {
     356   391813046 :     long d = dvmdsBIL(n, &m);
     357             :     long i;
     358             : 
     359   391714274 :     ny = nx + d + (m!=0);
     360   391714274 :     y = cgeti(ny + 2); yd = y + 2;
     361   544021875 :     for (i=0; i<d; i++) yd[i] = 0;
     362             : 
     363   390817402 :     if (!m) xmpn_copy((mp_limb_t *) (yd + d), (mp_limb_t *) x, nx);
     364             :     else
     365             :     {
     366   389282378 :       ulong carryd = mpn_lshift((mp_limb_t *) (yd + d), (mp_limb_t *) x, nx, m);
     367   389327882 :       if (carryd) yd[ny - 1] = carryd;
     368   366187192 :       else ny--;
     369             :     }
     370             :   }
     371             :   else
     372             :   {
     373   277392021 :     long d = dvmdsBIL(-n, &m);
     374             : 
     375   279215601 :     ny = nx - d;
     376   279215601 :     if (ny < 1) return gen_0;
     377   276325606 :     y = cgeti(ny + 2); yd = y + 2;
     378             : 
     379   276062446 :     if (!m) xmpn_copy((mp_limb_t *) yd, (mp_limb_t *) (x + d), nx - d);
     380             :     else
     381             :     {
     382   271412387 :       mpn_rshift((mp_limb_t *) yd, (mp_limb_t *) (x + d), nx - d, m);
     383   271426301 :       if (yd[ny - 1] == 0)
     384             :       {
     385    59857631 :         if (ny == 1) return gc_const((pari_sp)(yd + 1), gen_0);
     386    50385093 :         ny--;
     387             :       }
     388             :     }
     389             :   }
     390   655689895 :   y[1] = evalsigne(1)|evallgefint(ny + 2);
     391   655689895 :   return y;
     392             : }
     393             : 
     394             : GEN
     395   136877629 : mantissa2nr(GEN x, long n)
     396             : {
     397   136877629 :   long ly, i, m, s = signe(x), lx = lg(x);
     398             :   GEN y;
     399   136877629 :   if (!s) return gen_0;
     400   136876280 :   if (!n)
     401             :   {
     402    30149911 :     y = cgeti(lx);
     403    30147050 :     y[1] = evalsigne(s) | evallgefint(lx);
     404    30147050 :     xmpn_mirrorcopy(LIMBS(y),RLIMBS(x),lx-2);
     405    30146725 :     return y;
     406             :   }
     407   106726369 :   if (n > 0)
     408             :   {
     409      216924 :     GEN z = (GEN)avma;
     410      216924 :     long d = dvmdsBIL(n, &m);
     411             : 
     412      216924 :     ly = lx+d; y = new_chunk(ly);
     413      550186 :     for ( ; d; d--) *--z = 0;
     414      221300 :     if (!m) for (i=2; i<lx; i++) y[i]=x[i];
     415             :     else
     416             :     {
     417      215507 :       const ulong sh = BITS_IN_LONG - m;
     418      215507 :       shift_left(y,x, 2,lx-1, 0,m);
     419      215507 :       i = uel(x,2) >> sh;
     420             :       /* Extend y on the left? */
     421      215507 :       if (i) { ly++; y = new_chunk(1); y[2] = i; }
     422             :     }
     423             :   }
     424             :   else
     425             :   {
     426   106509445 :     ly = lx - dvmdsBIL(-n, &m);
     427   106503695 :     if (ly<3) return gen_0;
     428   106503695 :     y = new_chunk(ly);
     429   106467363 :     if (m) {
     430   106209657 :       shift_right(y,x, 2,ly, 0,m);
     431   106247202 :       if (y[2] == 0)
     432             :       {
     433           0 :         if (ly==3) return gc_const((pari_sp)(y+3), gen_0);
     434           0 :         ly--; set_avma((pari_sp)(++y));
     435             :       }
     436             :     } else {
     437      699455 :       for (i=2; i<ly; i++) y[i]=x[i];
     438             :     }
     439             :   }
     440   106721832 :   xmpn_mirror(LIMBS(y),ly-2);
     441   106770758 :   y[1] = evalsigne(s)|evallgefint(ly);
     442   106770758 :   y[0] = evaltyp(t_INT)|evallg(ly); return y;
     443             : }
     444             : 
     445             : GEN
     446     3523129 : truncr(GEN x)
     447             : {
     448             :   long s, e, d, m, i;
     449             :   GEN y;
     450     3523129 :   if ((s=signe(x)) == 0 || (e=expo(x)) < 0) return gen_0;
     451     1506503 :   d = nbits2lg(e+1); m = remsBIL(e);
     452     1506491 :   if (d > lg(x)) pari_err_PREC( "truncr (precision loss in truncation)");
     453             : 
     454     1506487 :   y=cgeti(d); y[1] = evalsigne(s) | evallgefint(d);
     455     1506409 :   if (++m == BITS_IN_LONG)
     456       95929 :     for (i=2; i<d; i++) y[d-i+1]=x[i];
     457             :   else
     458             :   {
     459     1458698 :     GEN z=cgeti(d);
     460     2984045 :     for (i=2; i<d; i++) z[d-i+1]=x[i];
     461     1458603 :     mpn_rshift(LIMBS(y),LIMBS(z),d-2,BITS_IN_LONG-m);
     462     1458610 :     set_avma((pari_sp)y);
     463             :   }
     464     1506295 :   return y;
     465             : }
     466             : 
     467             : /* integral part */
     468             : GEN
     469     6974153 : floorr(GEN x)
     470             : {
     471             :   long e, d, m, i, lx;
     472             :   GEN y;
     473     6974153 :   if (signe(x) >= 0) return truncr(x);
     474     4196988 :   if ((e=expo(x)) < 0) return gen_m1;
     475     3519487 :   d = nbits2lg(e+1); m = remsBIL(e);
     476     3516772 :   lx=lg(x); if (d>lx) pari_err_PREC( "floorr (precision loss in truncation)");
     477     3516772 :   y = cgeti(d+1);
     478     3507072 :   if (++m == BITS_IN_LONG)
     479             :   {
     480        3032 :     for (i=2; i<d; i++) y[d-i+1]=x[i];
     481        1447 :     i=d; while (i<lx && !x[i]) i++;
     482         903 :     if (i==lx) goto END;
     483             :   }
     484             :   else
     485             :   {
     486     3506169 :     GEN z=cgeti(d);
     487     7841574 :     for (i=2; i<d; i++) z[d-i+1]=x[i];
     488     3492657 :     mpn_rshift(LIMBS(y),LIMBS(z),d-2,BITS_IN_LONG-m);
     489     3493210 :     if (uel(x,d-1)<<m == 0)
     490             :     {
     491      516643 :       i=d; while (i<lx && !x[i]) i++;
     492      117876 :       if (i==lx) goto END;
     493             :     }
     494             :   }
     495     3419029 :   if (mpn_add_1(LIMBS(y),LIMBS(y),d-2,1))
     496           0 :     y[d++]=1;
     497     3419149 : END:
     498     3494233 :   y[1] = evalsigne(-1) | evallgefint(d);
     499     3494233 :   return y;
     500             : }
     501             : 
     502             : INLINE int
     503  3776242199 : cmpiispec(GEN x, GEN y, long lx, long ly)
     504             : {
     505  3776242199 :   if (lx < ly) return -1;
     506  3488648986 :   if (lx > ly) return  1;
     507  3339801971 :   return mpn_cmp((mp_limb_t*)x,(mp_limb_t*)y, lx);
     508             : }
     509             : 
     510             : INLINE int
     511   271721878 : equaliispec(GEN x, GEN y, long lx, long ly)
     512             : {
     513   271721878 :   if (lx != ly) return 0;
     514   271587072 :   return !mpn_cmp((mp_limb_t*)x,(mp_limb_t*)y, lx);
     515             : }
     516             : 
     517             : /***********************************************************************/
     518             : /**                                                                   **/
     519             : /**                          MULTIPLICATION                           **/
     520             : /**                                                                   **/
     521             : /***********************************************************************/
     522             : /* assume ny > 0 */
     523             : INLINE GEN
     524  5359886366 : muluispec(ulong x, GEN y, long ny)
     525             : {
     526  5359886366 :   if (ny == 1)
     527  4271877252 :     return muluu(x, *y);
     528             :   else
     529             :   {
     530  1088009114 :     long lz = ny+3;
     531  1088009114 :     GEN z = cgeti(lz);
     532  1097228493 :     ulong hi = mpn_mul_1 (LIMBS(z), (mp_limb_t *)y, ny, x);
     533  1098571012 :     if (hi) { z[lz - 1] = hi; } else lz--;
     534  1098571012 :     z[1] = evalsigne(1) | evallgefint(lz);
     535  1098571012 :     return z;
     536             :   }
     537             : }
     538             : 
     539             : /* a + b*|y| */
     540             : GEN
     541           0 : addumului(ulong a, ulong b, GEN y)
     542             : {
     543             :   GEN z;
     544             :   long i, lz;
     545             :   ulong hi;
     546           0 :   if (!b || !signe(y)) return utoi(a);
     547           0 :   lz = lgefint(y)+1;
     548           0 :   z = cgeti(lz);
     549           0 :   z[2]=a;
     550           0 :   for(i=3;i<lz;i++) z[i]=0;
     551           0 :   hi=mpn_addmul_1(LIMBS(z), LIMBS(y), NLIMBS(y), b);
     552           0 :   if (hi) z[lz-1]=hi; else lz--;
     553           0 :   z[1] = evalsigne(1) | evallgefint(lz);
     554           0 :   return gc_const((pari_sp)z, z);
     555             : }
     556             : 
     557             : /***********************************************************************/
     558             : /**                                                                   **/
     559             : /**                          DIVISION                                 **/
     560             : /**                                                                   **/
     561             : /***********************************************************************/
     562             : 
     563             : ulong
     564  1183036335 : umodiu(GEN y, ulong x)
     565             : {
     566  1183036335 :   long sy=signe(y);
     567             :   ulong hi;
     568  1183036335 :   if (!x) pari_err_INV("umodiu",gen_0);
     569  1183986828 :   if (!sy) return 0;
     570   868605392 :   hi = mpn_mod_1(LIMBS(y),NLIMBS(y),x);
     571   868605392 :   if (!hi) return 0;
     572   852649417 :   return (sy > 0)? hi: x - hi;
     573             : }
     574             : 
     575             : /* return |y| \/ x */
     576             : GEN
     577   110284323 : absdiviu_rem(GEN y, ulong x, ulong *rem)
     578             : {
     579             :   long ly;
     580             :   GEN z;
     581             : 
     582   110284323 :   if (!x) pari_err_INV("absdiviu_rem",gen_0);
     583   110290484 :   if (!signe(y)) { *rem = 0; return gen_0; }
     584             : 
     585    88279728 :   ly = lgefint(y);
     586    88279728 :   if (ly == 3 && (ulong)x > uel(y,2)) { *rem = uel(y,2); return gen_0; }
     587             : 
     588    73779567 :   z = cgeti(ly);
     589    73780060 :   *rem = mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
     590    73779893 :   if (z [ly - 1] == 0) ly--;
     591    73779893 :   z[1] = evallgefint(ly) | evalsigne(1);
     592    73779893 :   return z;
     593             : }
     594             : 
     595             : GEN
     596    83520671 : divis_rem(GEN y, long x, long *rem)
     597             : {
     598    83520671 :   long sy=signe(y),ly,s;
     599             :   GEN z;
     600             : 
     601    83520671 :   if (!x) pari_err_INV("divis_rem",gen_0);
     602    83532742 :   if (!sy) { *rem = 0; return gen_0; }
     603    59363351 :   if (x<0) { s = -sy; x = -x; } else s = sy;
     604             : 
     605    59363351 :   ly = lgefint(y);
     606    59363351 :   if (ly == 3 && (ulong)x > uel(y,2)) { *rem = itos(y); return gen_0; }
     607             : 
     608    41208900 :   z = cgeti(ly);
     609    41207229 :   *rem = mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
     610    41207420 :   if (sy<0) *rem = -  *rem;
     611    41207420 :   if (z[ly - 1] == 0) ly--;
     612    41207420 :   z[1] = evallgefint(ly) | evalsigne(s);
     613    41207420 :   return z;
     614             : }
     615             : 
     616             : GEN
     617      967231 : divis(GEN y, long x)
     618             : {
     619      967231 :   long sy=signe(y),ly,s;
     620             :   GEN z;
     621             : 
     622      967231 :   if (!x) pari_err_INV("divis",gen_0);
     623      967231 :   if (!sy) return gen_0;
     624      967183 :   if (x<0) { s = -sy; x = -x; } else s=sy;
     625             : 
     626      967183 :   ly = lgefint(y);
     627      967183 :   if (ly == 3 && (ulong)x > uel(y,2)) return gen_0;
     628             : 
     629      966871 :   z = cgeti(ly);
     630      966872 :   (void)mpn_divrem_1(LIMBS(z), 0, LIMBS(y), NLIMBS(y), x);
     631      966873 :   if (z[ly - 1] == 0) ly--;
     632      966873 :   z[1] = evallgefint(ly) | evalsigne(s);
     633      966873 :   return z;
     634             : }
     635             : 
     636             : /* We keep llx bits of x and lly bits of y*/
     637             : static GEN
     638    75498937 : divrr_with_gmp(GEN x, GEN y)
     639             : {
     640    75498937 :   long lx=RNLIMBS(x),ly=RNLIMBS(y);
     641    75498937 :   long lw=minss(lx,ly);
     642    75499798 :   long lly=minss(lw+1,ly);
     643    75501046 :   GEN  w = cgetg(lw+2, t_REAL);
     644    75483324 :   long lu=lw+lly;
     645    75483324 :   long llx=minss(lu,lx);
     646    75480359 :   mp_limb_t *u=(mp_limb_t *)new_chunk(lu);
     647    75459108 :   mp_limb_t *z=(mp_limb_t *)new_chunk(lly);
     648             :   mp_limb_t *q,*r;
     649    75427012 :   long e=expo(x)-expo(y);
     650    75427012 :   long sx=signe(x),sy=signe(y);
     651    75427012 :   xmpn_mirrorcopy(z,RLIMBS(y),lly);
     652    75442431 :   xmpn_mirrorcopy(u+lu-llx,RLIMBS(x),llx);
     653    75490741 :   xmpn_zero(u,lu-llx);
     654    75520134 :   q = (mp_limb_t *)new_chunk(lw+1);
     655    75503166 :   r = (mp_limb_t *)new_chunk(lly);
     656             : 
     657    75479593 :   mpn_tdiv_qr(q,r,0,u,lu,z,lly);
     658             : 
     659             :   /*Round up: This is not exactly correct we should test 2*r>z*/
     660    75529273 :   if (uel(r,lly-1) > (uel(z,lly-1)>>1))
     661    37425506 :     mpn_add_1(q,q,lw+1,1);
     662             : 
     663    75529336 :   xmpn_mirrorcopy(RLIMBS(w),q,lw);
     664             : 
     665    75527687 :   if (q[lw] == 0) e--;
     666    41803518 :   else if (q[lw] == 1) { shift_right(w,w, 2,lw+2, 1,1); }
     667           0 :   else { w[2] = HIGHBIT; e++; }
     668    75526295 :   if (sy < 0) sx = -sx;
     669    75526295 :   w[1] = evalsigne(sx) | evalexpo(e);
     670    75520511 :   return gc_const((pari_sp)w, w);
     671             : }
     672             : 
     673             : /* We keep llx bits of x and lly bits of y*/
     674             : static GEN
     675    35150767 : divri_with_gmp(GEN x, GEN y)
     676             : {
     677    35150767 :   long llx=RNLIMBS(x),ly=NLIMBS(y);
     678    35150767 :   long lly=minss(llx+1,ly);
     679    35150956 :   GEN  w = cgetg(llx+2, t_REAL);
     680    35146470 :   long lu=llx+lly, ld=ly-lly;
     681    35146470 :   mp_limb_t *u=(mp_limb_t *)new_chunk(lu);
     682    35142772 :   mp_limb_t *z=(mp_limb_t *)new_chunk(lly);
     683             :   mp_limb_t *q,*r;
     684    35136965 :   long sh=bfffo(y[ly+1]);
     685    35136965 :   long e=expo(x)-expi(y);
     686    35137739 :   long sx=signe(x),sy=signe(y);
     687    35137739 :   if (sh) mpn_lshift(z,LIMBS(y)+ld,lly,sh);
     688      682994 :   else xmpn_copy(z,LIMBS(y)+ld,lly);
     689    35139458 :   xmpn_mirrorcopy(u+lu-llx,RLIMBS(x),llx);
     690    35147587 :   xmpn_zero(u,lu-llx);
     691    35153398 :   q = (mp_limb_t *)new_chunk(llx+1);
     692    35151328 :   r = (mp_limb_t *)new_chunk(lly);
     693             : 
     694    35146711 :   mpn_tdiv_qr(q,r,0,u,lu,z,lly);
     695             : 
     696             :   /*Round up: This is not exactly correct we should test 2*r>z*/
     697    35156498 :   if (uel(r,lly-1) > (uel(z,lly-1)>>1))
     698    16008138 :     mpn_add_1(q,q,llx+1,1);
     699             : 
     700    35156505 :   xmpn_mirrorcopy(RLIMBS(w),q,llx);
     701             : 
     702    35156216 :   if (q[llx] == 0) e--;
     703    10568592 :   else if (q[llx] == 1) { shift_right(w,w, 2,llx+2, 1,1); }
     704           0 :   else { w[2] = HIGHBIT; e++; }
     705    35156042 :   if (sy < 0) sx = -sx;
     706    35156042 :   w[1] = evalsigne(sx) | evalexpo(e);
     707    35154958 :   return gc_const((pari_sp)w, w);
     708             : }
     709             : 
     710             : GEN
     711   150083962 : divri(GEN x, GEN y)
     712             : {
     713   150083962 :   long  s = signe(y);
     714             : 
     715   150083962 :   if (!s) pari_err_INV("divri",gen_0);
     716   150084185 :   if (!signe(x)) return real_0_bit(expo(x) - expi(y));
     717   149854658 :   if (!is_bigint(y)) {
     718   114709449 :     GEN z = divru(x, y[2]);
     719   114708289 :     if (s < 0) togglesign(z);
     720   114708327 :     return z;
     721             :   }
     722    35144388 :   return divri_with_gmp(x,y);
     723             : }
     724             : 
     725             : GEN
     726   141252517 : divrr(GEN x, GEN y)
     727             : {
     728   141252517 :   long sx=signe(x), sy=signe(y), lx,ly,lr,e,i,j;
     729             :   ulong y0,y1;
     730             :   GEN r, r1;
     731             : 
     732   141252517 :   if (!sy) pari_err_INV("divrr",y);
     733   141261425 :   e = expo(x) - expo(y);
     734   141261425 :   if (!sx) return real_0_bit(e);
     735   140763369 :   if (sy<0) sx = -sx;
     736             : 
     737   140763369 :   lx=lg(x); ly=lg(y);
     738   140763369 :   if (ly==3)
     739             :   {
     740    26099245 :     ulong k = x[2], l = (lx>3)? x[3]: 0;
     741             :     LOCAL_HIREMAINDER;
     742    26099245 :     if (k < uel(y,2)) e--;
     743             :     else
     744             :     {
     745     8190616 :       l >>= 1; if (k&1) l |= HIGHBIT;
     746     8190616 :       k >>= 1;
     747             :     }
     748    26099245 :     hiremainder = k; k = divll(l,y[2]);
     749    26099245 :     if (hiremainder > (uel(y,2) >> 1) && !++k) { k = HIGHBIT; e++; }
     750    26099245 :     r = cgetg(3, t_REAL);
     751    26100937 :     r[1] = evalsigne(sx) | evalexpo(e);
     752    26098714 :     r[2] = k; return r;
     753             :   }
     754             : 
     755   114664124 :   if (ly >= prec2lg(DIVRR_GMP_LIMIT))
     756    75498584 :     return divrr_with_gmp(x,y);
     757             : 
     758    39218217 :   lr = minss(lx,ly); r = new_chunk(lr);
     759    39227126 :   r1 = r-1;
     760   133233369 :   r1[1] = 0; for (i=2; i<lr; i++) r1[i]=x[i];
     761    39227126 :   r1[lr] = (lx>ly)? x[lr]: 0;
     762    39227126 :   y0 = y[2]; y1 = y[3];
     763   172419248 :   for (i=0; i<lr-1; i++)
     764             :   { /* r1 = r + (i-1), OK up to r1[2] (accesses at most r[lr]) */
     765             :     ulong k, qp;
     766             :     LOCAL_HIREMAINDER;
     767             :     LOCAL_OVERFLOW;
     768             : 
     769   133192122 :     if (uel(r1,1) == y0) { qp = ULONG_MAX; k = addll(y0,r1[2]); }
     770             :     else
     771             :     {
     772   132947145 :       if (uel(r1,1) > y0) /* can't happen if i=0 */
     773             :       {
     774           0 :         GEN y1 = y+1;
     775           0 :         j = lr-i; r1[j] = subll(r1[j],y1[j]);
     776           0 :         for (j--; j>0; j--) r1[j] = subllx(r1[j],y1[j]);
     777           0 :         j=i; do uel(r,--j)++; while (j && !r[j]);
     778             :       }
     779   132947145 :       hiremainder = r1[1]; overflow = 0;
     780   132947145 :       qp = divll(r1[2],y0); k = hiremainder;
     781             :     }
     782   133192122 :     j = lr-i+1;
     783   133192122 :     if (!overflow)
     784             :     {
     785             :       long k3, k4;
     786   133046573 :       k3 = mulll(qp,y1);
     787   133046573 :       if (j == 3) /* i = lr - 2 maximal, r1[3] undefined -> 0 */
     788    39279368 :         k4 = subll(hiremainder,k);
     789             :       else
     790             :       {
     791    93767205 :         k3 = subll(k3, r1[3]);
     792    93767205 :         k4 = subllx(hiremainder,k);
     793             :       }
     794   170685532 :       while (!overflow && k4) { qp--; k3=subll(k3,y1); k4=subllx(k4,y0); }
     795             :     }
     796   133192122 :     if (j<ly) (void)mulll(qp,y[j]); else { hiremainder = 0 ; j = ly; }
     797   395171739 :     for (j--; j>1; j--)
     798             :     {
     799   261979617 :       r1[j] = subll(r1[j], addmul(qp,y[j]));
     800   261979617 :       hiremainder += overflow;
     801             :     }
     802   133192122 :     if (uel(r1,1) != hiremainder)
     803             :     {
     804      181660 :       if (uel(r1,1) < hiremainder)
     805             :       {
     806      181660 :         qp--;
     807      181660 :         j = lr-i-(lr-i>=ly); r1[j] = addll(r1[j], y[j]);
     808      517154 :         for (j--; j>1; j--) r1[j] = addllx(r1[j], y[j]);
     809             :       }
     810             :       else
     811             :       {
     812           0 :         uel(r1,1) -= hiremainder;
     813           0 :         while (r1[1])
     814             :         {
     815           0 :           qp++; if (!qp) { j=i; do uel(r,--j)++; while (j && !r[j]); }
     816           0 :           j = lr-i-(lr-i>=ly); r1[j] = subll(r1[j],y[j]);
     817           0 :           for (j--; j>1; j--) r1[j] = subllx(r1[j],y[j]);
     818           0 :           uel(r1,1) -= overflow;
     819             :         }
     820             :       }
     821             :     }
     822   133192122 :     *++r1 = qp;
     823             :   }
     824             :   /* i = lr-1 */
     825             :   /* round correctly */
     826    39227126 :   if (uel(r1,1) > (y0>>1))
     827             :   {
     828    19781093 :     j=i; do uel(r,--j)++; while (j && !r[j]);
     829             :   }
     830   133406012 :   r1 = r-1; for (j=i; j>=2; j--) r[j]=r1[j];
     831    39227126 :   if (r[0] == 0) e--;
     832    14141825 :   else if (r[0] == 1) { shift_right(r,r, 2,lr, 1,1); }
     833             :   else { /* possible only when rounding up to 0x2 0x0 ... */
     834          18 :     r[2] = (long)HIGHBIT; e++;
     835             :   }
     836    39225991 :   r[0] = evaltyp(t_REAL)|evallg(lr);
     837    39280001 :   r[1] = evalsigne(sx) | evalexpo(e);
     838    39272933 :   return r;
     839             : }
     840             : 
     841             : /* Integer division x / y: such that sign(r) = sign(x)
     842             :  *   if z = ONLY_REM return remainder, otherwise return quotient
     843             :  *   if z != NULL set *z to remainder
     844             :  *   *z is the last object on stack (and thus can be disposed of with cgiv
     845             :  *   instead of gerepile)
     846             :  * If *z is zero, we put gen_0 here and no copy.
     847             :  * space needed: lx + ly
     848             :  */
     849             : GEN
     850  1882393282 : dvmdii(GEN x, GEN y, GEN *z)
     851             : {
     852  1882393282 :   long sx=signe(x),sy=signe(y);
     853             :   long lx, ly, lq;
     854             :   pari_sp av;
     855             :   GEN r,q;
     856             : 
     857  1882393282 :   if (!sy) pari_err_INV("dvmdii",y);
     858  1883459101 :   if (!sx)
     859             :   {
     860    66080969 :     if (!z || z == ONLY_REM) return gen_0;
     861    40517790 :     *z=gen_0; return gen_0;
     862             :   }
     863  1817378132 :   lx=lgefint(x);
     864  1817378132 :   ly=lgefint(y); lq=lx-ly;
     865  1817378132 :   if (lq <= 0)
     866             :   {
     867  1138531461 :     if (lq == 0)
     868             :     {
     869  1030271416 :       long s=mpn_cmp(LIMBS(x),LIMBS(y),NLIMBS(x));
     870  1030271416 :       if (s>0) goto DIVIDE;
     871   351462467 :       if (s==0)
     872             :       {
     873    30289912 :         if (z == ONLY_REM) return gen_0;
     874    19998206 :         if (z) *z = gen_0;
     875    19998206 :         if (sx < 0) sy = -sy;
     876    19998206 :         return stoi(sy);
     877             :       }
     878             :     }
     879   429432600 :     if (z == ONLY_REM) return icopy(x);
     880    12324660 :     if (z) *z = icopy(x);
     881    12324660 :     return gen_0;
     882             :   }
     883   678846671 : DIVIDE: /* quotient is nonzero */
     884  1357655620 :   av=avma; if (sx<0) sy = -sy;
     885  1357655620 :   if (ly==3)
     886             :   {
     887   559175151 :     ulong lq = lx;
     888             :     ulong si;
     889   559175151 :     q  = cgeti(lq);
     890   558786927 :     si = mpn_divrem_1(LIMBS(q), 0, LIMBS(x), NLIMBS(x), y[2]);
     891   559337995 :     if (q[lq - 1] == 0) lq--;
     892   559337995 :     if (z == ONLY_REM)
     893             :     {
     894   323988716 :       if (!si) return gc_const(av, gen_0);
     895   281757159 :       set_avma(av); r = cgeti(3);
     896   281283457 :       r[1] = evalsigne(sx) | evallgefint(3);
     897   281283457 :       r[2] = si; return r;
     898             :     }
     899   235349279 :     q[1] = evalsigne(sy) | evallgefint(lq);
     900   235349279 :     if (!z) return q;
     901   231263465 :     if (!si) { *z=gen_0; return q; }
     902    59861813 :     r=cgeti(3);
     903    59886864 :     r[1] = evalsigne(sx) | evallgefint(3);
     904    59886864 :     r[2] = si; *z=r; return q;
     905             :   }
     906   798480469 :   if (z == ONLY_REM)
     907             :   {
     908   776145651 :     ulong lr = lgefint(y);
     909   776145651 :     ulong lq = lgefint(x)-lgefint(y)+3;
     910   776145651 :     GEN r = cgeti(lr);
     911   770352664 :     GEN q = cgeti(lq);
     912   763943876 :     mpn_tdiv_qr(LIMBS(q), LIMBS(r),0, LIMBS(x), NLIMBS(x), LIMBS(y), NLIMBS(y));
     913   777578310 :     if (!r[lr - 1])
     914             :     {
     915   807553964 :       while(lr>2 && !r[lr - 1]) lr--;
     916   359288601 :       if (lr == 2) return gc_const(av, gen_0); /* exact division */
     917             :     }
     918   762917040 :     r[1] = evalsigne(sx) | evallgefint(lr);
     919   762917040 :     return gc_const((pari_sp)r, r);
     920             :   }
     921             :   else
     922             :   {
     923    22334818 :     ulong lq = lgefint(x)-lgefint(y)+3;
     924    22334818 :     ulong lr = lgefint(y);
     925    22334818 :     GEN q = cgeti(lq);
     926    27476896 :     GEN r = cgeti(lr);
     927    27464544 :     mpn_tdiv_qr(LIMBS(q), LIMBS(r),0, LIMBS(x), NLIMBS(x), LIMBS(y), NLIMBS(y));
     928    27489253 :     if (q[lq - 1] == 0) lq--;
     929    27489253 :     q[1] = evalsigne(sy) | evallgefint(lq);
     930    27489253 :     if (!z) return gc_const((pari_sp)q, q);
     931    23792446 :     if (!r[lr - 1])
     932             :     {
     933    36691480 :       while(lr>2 && !r[lr - 1]) lr--;
     934     6116741 :       if (lr == 2) { *z = gen_0; return gc_const((pari_sp)q, q); } /* exact */
     935             :     }
     936    19194171 :     r[1] = evalsigne(sx) | evallgefint(lr);
     937    19194171 :     *z = gc_const((pari_sp)r, r); return q;
     938             :   }
     939             : }
     940             : 
     941             : /* Montgomery reduction.
     942             :  * N has k words, assume T >= 0 has less than 2k.
     943             :  * Return res := T / B^k mod N, where B = 2^BIL
     944             :  * such that 0 <= res < T/B^k + N  and  res has less than k words */
     945             : GEN
     946    36636183 : red_montgomery(GEN T, GEN N, ulong inv)
     947             : {
     948             :   pari_sp av;
     949             :   GEN Te, Td, Ne, Nd, scratch;
     950    36636183 :   ulong i, j, m, t, d, k = NLIMBS(N);
     951             :   int carry;
     952             :   LOCAL_HIREMAINDER;
     953             :   LOCAL_OVERFLOW;
     954             : 
     955    36636183 :   if (k == 0) return gen_0;
     956    36636183 :   d = NLIMBS(T); /* <= 2*k */
     957    36636183 :   if (d == 0) return gen_0;
     958             : #ifdef DEBUG
     959             :   if (d > 2*k) pari_err_BUG("red_montgomery");
     960             : #endif
     961    36636174 :   if (k == 1)
     962             :   { /* as below, special cased for efficiency */
     963      163341 :     ulong n = uel(N,2);
     964      163341 :     if (d == 1) {
     965      163194 :       hiremainder = uel(T,2);
     966      163194 :       m = hiremainder * inv;
     967      163194 :       (void)addmul(m, n); /* t + m*n = 0 */
     968      163194 :       return utoi(hiremainder);
     969             :     } else { /* d = 2 */
     970         147 :       hiremainder = uel(T,2);
     971         147 :       m = hiremainder * inv;
     972         147 :       (void)addmul(m, n); /* t + m*n = 0 */
     973         147 :       t = addll(hiremainder, uel(T,3));
     974         147 :       if (overflow) t -= n; /* t > n doesn't fit in 1 word */
     975         147 :       return utoi(t);
     976             :     }
     977             :   }
     978             :   /* assume k >= 2 */
     979    36472833 :   av = avma; scratch = new_chunk(k<<1); /* >= k + 2: result fits */
     980             : 
     981             :   /* copy T to scratch space (pad with zeroes to 2k words) */
     982    36174066 :   Td = scratch;
     983    36174066 :   Te = T + 2;
     984   522426851 :   for (i=0; i < d     ; i++) *Td++ = *Te++;
     985    64515038 :   for (   ; i < (k<<1); i++) *Td++ = 0;
     986             : 
     987    36174066 :   Te = scratch - 1; /* 1 beyond end of current T mantissa (in scratch) */
     988    36174066 :   Ne = N + 1;       /* 1 beyond end of N mantissa */
     989             : 
     990    36174066 :   carry = 0;
     991   276162888 :   for (i=0; i<k; i++) /* set T := T/B nod N, k times */
     992             :   {
     993   239988822 :     Td = Te; /* one beyond end of (new) T mantissa */
     994   239988822 :     Nd = Ne;
     995   239988822 :     hiremainder = *++Td;
     996   239988822 :     m = hiremainder * inv; /* solve T + m N = O(B) */
     997             : 
     998             :     /* set T := (T + mN) / B */
     999   239988822 :     Te = Td;
    1000   239988822 :     (void)addmul(m, *++Nd); /* = 0 */
    1001  2123176605 :     for (j=1; j<k; j++)
    1002             :     {
    1003  1883187783 :       t = addll(addmul(m, *++Nd), *++Td);
    1004  1883187783 :       *Td = t;
    1005  1883187783 :       hiremainder += overflow;
    1006             :     }
    1007   239988822 :     t = addll(hiremainder, *++Td); *Td = t + carry;
    1008   239988822 :     carry = (overflow || (carry && *Td == 0));
    1009             :   }
    1010    36174066 :   if (carry)
    1011             :   { /* Td > N overflows (k+1 words), set Td := Td - N */
    1012       57116 :     GEN NE = N + k+1;
    1013       57116 :     Td = Te;
    1014       57116 :     Nd = Ne;
    1015       57116 :     t = subll(*++Td, *++Nd); *Td = t;
    1016      516497 :     while (Nd < NE) { t = subllx(*++Td, *++Nd); *Td = t; }
    1017             :   }
    1018             : 
    1019             :   /* copy result */
    1020    36174066 :   Td = (GEN)av - 1; /* *Td = high word of final result */
    1021    39669413 :   while (*Td == 0 && Te < Td) Td--; /* strip leading 0s */
    1022    36174066 :   k = Td - Te; if (!k) return gc_const(av, gen_0);
    1023    36174066 :   Td = (GEN)av - k; /* will write mantissa there */
    1024    36174066 :   (void)memmove(Td, Te+1, k*sizeof(long));
    1025    36174066 :   Td -= 2;
    1026    36174066 :   Td[0] = evaltyp(t_INT) | evallg(k+2);
    1027    36453342 :   Td[1] = evalsigne(1) | evallgefint(k+2);
    1028             : #ifdef DEBUG
    1029             : {
    1030             :   long l = NLIMBS(N), s = BITS_IN_LONG*l;
    1031             :   GEN R = int2n(s);
    1032             :   GEN res = remii(mulii(T, Fp_inv(R, N)), N);
    1033             :   if (k > lgefint(N)
    1034             :     || !equalii(remii(Td,N),res)
    1035             :     || cmpii(Td, addii(shifti(T, -s), N)) >= 0) pari_err_BUG("red_montgomery");
    1036             : }
    1037             : #endif
    1038    36453342 :   return gc_const((pari_sp)Td, Td);
    1039             : }
    1040             : 
    1041             : /* EXACT INTEGER DIVISION */
    1042             : 
    1043             : /* use undocumented GMP interface */
    1044             : static void
    1045   110611181 : GEN2mpz(mpz_t X, GEN x)
    1046             : {
    1047   110611181 :   long l = lgefint(x)-2;
    1048   110611181 :   X->_mp_alloc = l;
    1049   110611181 :   X->_mp_size = signe(x) > 0? l: -l;
    1050   110611181 :   X->_mp_d = LIMBS(x);
    1051   110611181 : }
    1052             : static void
    1053    55306793 : mpz2GEN(GEN z, mpz_t Z)
    1054             : {
    1055    55306793 :   long l = Z->_mp_size;
    1056    55306793 :   z[1] = evalsigne(l > 0? 1: -1) | evallgefint(labs(l)+2);
    1057    55306793 : }
    1058             : 
    1059             : #ifdef mpn_divexact_1
    1060             : static GEN
    1061   373844949 : diviuexact_i(GEN x, ulong y)
    1062             : {
    1063   373844949 :   long l = lgefint(x);
    1064   373844949 :   GEN z = cgeti(l);
    1065   373427350 :   mpn_divexact_1(LIMBS(z), LIMBS(x), NLIMBS(x), y);
    1066   373479166 :   if (z[l-1] == 0) l--;
    1067   373479166 :   z[1] = evallgefint(l) | evalsigne(signe(x));
    1068   373479166 :   return z;
    1069             : }
    1070             : #elif 1 && !defined(_WIN64) /* mpz_divexact_ui is not LLP64 friendly   */
    1071             :                             /* assume y != 0 and the division is exact */
    1072             : static GEN
    1073             : diviuexact_i(GEN x, ulong y)
    1074             : {
    1075             :   long l = lgefint(x);
    1076             :   GEN z = cgeti(l);
    1077             :   mpz_t X, Z;
    1078             :   GEN2mpz(X, x);
    1079             :   Z->_mp_alloc = l-2;
    1080             :   Z->_mp_size  = l-2;
    1081             :   Z->_mp_d = LIMBS(z);
    1082             :   mpz_divexact_ui(Z, X, y);
    1083             :   mpz2GEN(z, Z); return z;
    1084             : }
    1085             : #else
    1086             : /* assume y != 0 and the division is exact */
    1087             : static GEN
    1088             : diviuexact_i(GEN x, ulong y)
    1089             : {
    1090             :   /*TODO: implement true exact division.*/
    1091             :   return divii(x,utoi(y));
    1092             : }
    1093             : #endif
    1094             : 
    1095             : GEN
    1096    31048565 : diviuexact(GEN x, ulong y)
    1097             : {
    1098             :   GEN z;
    1099    31048565 :   if (!signe(x)) return gen_0;
    1100    29919993 :   z = diviuexact_i(x, y);
    1101    29917376 :   if (lgefint(z) == 2) pari_err_OP("exact division", x, utoi(y));
    1102    29917431 :   return z;
    1103             : }
    1104             : 
    1105             : /* Find z such that x=y*z, knowing that y | x (unchecked) */
    1106             : GEN
    1107   475494675 : diviiexact(GEN x, GEN y)
    1108             : {
    1109             :   GEN z;
    1110   475494675 :   if (!signe(y)) pari_err_INV("diviiexact",y);
    1111   475657230 :   if (!signe(x)) return gen_0;
    1112   399403991 :   if (lgefint(y) == 3)
    1113             :   {
    1114   344116478 :     z = diviuexact_i(x, y[2]);
    1115   343749973 :     if (signe(y) < 0) togglesign(z);
    1116             :   }
    1117             :   else
    1118             :   {
    1119    55287513 :     long l = lgefint(x);
    1120             :     mpz_t X, Y, Z;
    1121    55287513 :     z = cgeti(l);
    1122    55305759 :     GEN2mpz(X, x);
    1123    55305678 :     GEN2mpz(Y, y);
    1124    55305549 :     Z->_mp_alloc = l-2;
    1125    55305549 :     Z->_mp_size  = l-2;
    1126    55305549 :     Z->_mp_d = LIMBS(z);
    1127    55305549 :     mpz_divexact(Z, X, Y);
    1128    55306811 :     mpz2GEN(z, Z);
    1129             :   }
    1130   399056761 :   if (lgefint(z) == 2) pari_err_OP("exact division", x, y);
    1131   399039126 :   return z;
    1132             : }
    1133             : 
    1134             : /* assume yz != and yz | x */
    1135             : GEN
    1136      199439 : diviuuexact(GEN x, ulong y, ulong z)
    1137             : {
    1138             :   long tmp[4];
    1139             :   ulong t;
    1140             :   LOCAL_HIREMAINDER;
    1141      199439 :   t = mulll(y, z);
    1142      199439 :   if (!hiremainder) return diviuexact(x, t);
    1143           0 :   tmp[0] = evaltyp(t_INT)|_evallg(4);
    1144           0 :   tmp[1] = evalsigne(1)|evallgefint(4);
    1145           0 :   tmp[2] = t;
    1146           0 :   tmp[3] = hiremainder;
    1147           0 :   return diviiexact(x, tmp);
    1148             : }
    1149             : 
    1150             : /********************************************************************/
    1151             : /**                                                                **/
    1152             : /**               INTEGER MULTIPLICATION                           **/
    1153             : /**                                                                **/
    1154             : /********************************************************************/
    1155             : 
    1156             : /* nx >= ny = num. of digits of x, y (not GEN, see mulii) */
    1157             : GEN
    1158  5692927649 : muliispec(GEN x, GEN y, long nx, long ny)
    1159             : {
    1160             :   GEN zd;
    1161             :   long lz;
    1162             :   ulong hi;
    1163             : 
    1164  5692927649 :   if (nx < ny) swapspec(x,y, nx,ny);
    1165  5692927649 :   if (!ny) return gen_0;
    1166  5692927649 :   if (ny == 1) return muluispec((ulong)*y, x, nx);
    1167             : 
    1168  1026691596 :   lz = nx+ny+2;
    1169  1026691596 :   zd = cgeti(lz);
    1170  1029906470 :   hi = mpn_mul(LIMBS(zd), (mp_limb_t *)x, nx, (mp_limb_t *)y, ny);
    1171  1036866440 :   if (!hi) lz--;
    1172             :   /*else zd[lz-1]=hi; GH tell me it is not necessary.*/
    1173             : 
    1174  1036866440 :   zd[1] = evalsigne(1) | evallgefint(lz);
    1175  1036866440 :   return zd;
    1176             : }
    1177             : GEN
    1178      221676 : muluui(ulong x, ulong y, GEN z)
    1179             : {
    1180      221676 :   long t, s = signe(z);
    1181             :   GEN r;
    1182             :   LOCAL_HIREMAINDER;
    1183             : 
    1184      221676 :   if (!x || !y || !signe(z)) return gen_0;
    1185      221300 :   t = mulll(x,y);
    1186      221300 :   if (!hiremainder)
    1187      221314 :     r = muluispec(t, z+2, lgefint(z)-2);
    1188             :   else
    1189             :   {
    1190             :     long tmp[2];
    1191           0 :     tmp[1] = hiremainder;
    1192           0 :     tmp[0] = t;
    1193           0 :     r = muliispec(z+2,tmp, lgefint(z)-2, 2);
    1194             :   }
    1195      221279 :   setsigne(r,s); return r;
    1196             : }
    1197             : 
    1198             : GEN
    1199   986045386 : sqrispec(GEN x, long nx)
    1200             : {
    1201             :   GEN zd;
    1202             :   long lz;
    1203             : 
    1204   986045386 :   if (!nx) return gen_0;
    1205   478972834 :   if (nx==1) return sqru(*x);
    1206             : 
    1207   274246392 :   lz = (nx<<1)+2;
    1208   274246392 :   zd = cgeti(lz);
    1209             : #ifdef mpn_sqr
    1210   271329000 :   mpn_sqr(LIMBS(zd), (mp_limb_t *)x, nx);
    1211             : #else
    1212             :   mpn_mul_n(LIMBS(zd), (mp_limb_t *)x, (mp_limb_t *)x, nx);
    1213             : #endif
    1214   274779567 :   if (zd[lz-1]==0) lz--;
    1215             : 
    1216   274779567 :   zd[1] = evalsigne(1) | evallgefint(lz);
    1217   274779567 :   return zd;
    1218             : }
    1219             : 
    1220             : INLINE GEN
    1221    41347024 : sqrispec_mirror(GEN x, long nx)
    1222             : {
    1223    41347024 :   GEN cx=new_chunk(nx);
    1224             :   GEN z;
    1225    41300352 :   xmpn_mirrorcopy((mp_limb_t *)cx,(mp_limb_t *)x,nx);
    1226    41413259 :   z=sqrispec(cx, nx);
    1227    41489665 :   xmpn_mirror(LIMBS(z), NLIMBS(z));
    1228    41486556 :   return z;
    1229             : }
    1230             : 
    1231             : /* leaves garbage on the stack. */
    1232             : INLINE GEN
    1233    83746084 : muliispec_mirror(GEN x, GEN y, long nx, long ny)
    1234             : {
    1235             :   GEN cx, cy, z;
    1236    83746084 :   long s = 0;
    1237   112754227 :   while (nx && x[nx-1]==0) { nx--; s++; }
    1238   118120154 :   while (ny && y[ny-1]==0) { ny--; s++; }
    1239    83746084 :   cx=new_chunk(nx); cy=new_chunk(ny);
    1240    83194105 :   xmpn_mirrorcopy((mp_limb_t *)cx,(mp_limb_t *)x,nx);
    1241    84081883 :   xmpn_mirrorcopy((mp_limb_t *)cy,(mp_limb_t *)y,ny);
    1242    84590210 :   z =  nx>=ny ? muliispec(cx, cy, nx, ny): muliispec(cy, cx, ny, nx);
    1243    84716556 :   if (s)
    1244             :   {
    1245     7631841 :     long i, lz = lgefint(z) + s;
    1246     7631841 :     (void)new_chunk(s);
    1247     7631840 :     z -= s;
    1248    71014056 :     for (i=0; i<s; i++) z[2+i]=0;
    1249     7631840 :     z[1] = evalsigne(1) | evallgefint(lz);
    1250     7631840 :     z[0] = evaltyp(t_INT) | evallg(lz);
    1251             :   }
    1252    84716553 :   xmpn_mirror(LIMBS(z), NLIMBS(z));
    1253    85218049 :   return z;
    1254             : }
    1255             : 
    1256             : /* x % (2^n), assuming n >= 0 */
    1257             : GEN
    1258    36024651 : remi2n(GEN x, long n)
    1259             : {
    1260             :   ulong hi;
    1261    36024651 :   long l, k, lx, ly, sx = signe(x);
    1262             :   GEN z, xd, zd;
    1263             : 
    1264    36024651 :   if (!sx || !n) return gen_0;
    1265             : 
    1266    35710754 :   k = dvmdsBIL(n, &l);
    1267    35724908 :   lx = lgefint(x);
    1268    35724908 :   if (lx < k+3) return icopy(x);
    1269             : 
    1270    34860098 :   xd = x + (2 + k);
    1271             :   /* x = |k|...|1|#|... : copy the last l bits of # and the first k words
    1272             :    *              ^--- initial xd  */
    1273    34860098 :   hi = ((ulong)*xd) & ((1UL<<l)-1); /* last l bits of # = top bits of result */
    1274    34860098 :   if (!hi)
    1275             :   { /* strip leading zeroes from result */
    1276     3168676 :     xd--; while (k && !*xd) { k--; xd--; }
    1277     2983207 :     if (!k) return gen_0;
    1278     2038118 :     ly = k+2;
    1279             :   }
    1280             :   else
    1281    31876891 :     ly = k+3;
    1282             : 
    1283    33915009 :   zd = z = cgeti(ly);
    1284    33877312 :   *++zd = evalsigne(sx) | evallgefint(ly);
    1285   499616532 :   xd = x+1; for ( ;k; k--) *++zd = *++xd;
    1286    33877312 :   if (hi) *++zd = hi;
    1287    33877312 :   return z;
    1288             : }
    1289             : 
    1290             : /********************************************************************/
    1291             : /**                                                                **/
    1292             : /**                      INTEGER SQUARE ROOT                       **/
    1293             : /**                                                                **/
    1294             : /********************************************************************/
    1295             : 
    1296             : /* Return S (and set R) s.t S^2 + R = N, 0 <= R <= 2S.
    1297             :  * As for dvmdii, R is last on stack and guaranteed to be gen_0 in case the
    1298             :  * remainder is 0. R = NULL is allowed. */
    1299             : GEN
    1300     5106376 : sqrtremi(GEN a, GEN *r)
    1301             : {
    1302     5106376 :   long l, na = NLIMBS(a);
    1303             :   mp_size_t nr;
    1304             :   GEN S;
    1305     5106376 :   if (!na) {
    1306         724 :     if (r) *r = gen_0;
    1307         724 :     return gen_0;
    1308             :   }
    1309     5105652 :   l = (na + 5) >> 1; /* 2 + ceil(na/2) */
    1310     5105652 :   S = cgetipos(l);
    1311     5105612 :   if (r) {
    1312     1309159 :     GEN R = cgeti(2 + na);
    1313     1309159 :     nr = mpn_sqrtrem(LIMBS(S), LIMBS(R), LIMBS(a), na);
    1314     1309159 :     if (nr) R[1] = evalsigne(1) | evallgefint(nr+2);
    1315       25588 :     else    { set_avma((pari_sp)S); R = gen_0; }
    1316     1309159 :     *r = R;
    1317             :   }
    1318             :   else
    1319     3796453 :     (void)mpn_sqrtrem(LIMBS(S), NULL, LIMBS(a), na);
    1320     5105622 :   return S;
    1321             : }
    1322             : 
    1323             : /* compute sqrt(|a|), assuming a != 0 */
    1324             : GEN
    1325   124897562 : sqrtr_abs(GEN a)
    1326             : {
    1327             :   GEN res;
    1328             :   mp_limb_t *b, *c;
    1329   124897562 :   long l = RNLIMBS(a), e = expo(a), er = e>>1;
    1330             :   long n;
    1331   124897562 :   res = cgetg(2 + l, t_REAL);
    1332   124811885 :   res[1] = evalsigne(1) | evalexpo(er);
    1333   124891774 :   if (e&1)
    1334             :   {
    1335    52484940 :     b = (mp_limb_t *) new_chunk(l<<1);
    1336    52469273 :     xmpn_zero(b,l);
    1337    52470241 :     xmpn_mirrorcopy(b+l, RLIMBS(a), l);
    1338    52482884 :     c = (mp_limb_t *) new_chunk(l);
    1339    52476672 :     n = mpn_sqrtrem(c,b,b,l<<1); /* c <- sqrt; b <- rem */
    1340    52513467 :     if (n>l || (n==l && mpn_cmp(b,c,l) > 0)) mpn_add_1(c,c,l,1);
    1341             :   }
    1342             :   else
    1343             :   {
    1344             :     ulong u;
    1345    72406834 :     b = (mp_limb_t *) mantissa2nr(a,-1);
    1346    72441799 :     b[1] = uel(a,l+1)<<(BITS_IN_LONG-1);
    1347    72441799 :     b = (mp_limb_t *) new_chunk(l);
    1348    72419382 :     xmpn_zero(b,l+1); /* overwrites the former b[0] */
    1349    72422220 :     c = (mp_limb_t *) new_chunk(l + 1);
    1350    72385461 :     n = mpn_sqrtrem(c,b,b,(l<<1)+2); /* c <- sqrt; b <- rem */
    1351    72483594 :     u = (ulong)*c++;
    1352    72483594 :     if ( u&HIGHBIT || (u == ~HIGHBIT &&
    1353           0 :              (n>l || (n==l && mpn_cmp(b,c,l)>0))))
    1354    35714676 :       mpn_add_1(c,c,l,1);
    1355             :   }
    1356   125006634 :   xmpn_mirrorcopy(RLIMBS(res),c,l);
    1357   124977706 :   return gc_const((pari_sp)res, res);
    1358             : }
    1359             : 
    1360             : /* Normalize a nonnegative integer */
    1361             : GEN
    1362   302633496 : int_normalize(GEN x, long known_zero_words)
    1363             : {
    1364   302633496 :   long i =  lgefint(x) - 1 - known_zero_words;
    1365  2197711970 :   for ( ; i > 1; i--)
    1366  2147757843 :     if (x[i]) { setlgefint(x, i+1); return x; }
    1367    49954127 :   x[1] = evalsigne(0) | evallgefint(2); return x;
    1368             : }
    1369             : 
    1370             : /********************************************************************
    1371             :  **                                                                **
    1372             :  **                           Base Conversion                      **
    1373             :  **                                                                **
    1374             :  ********************************************************************/
    1375             : 
    1376             : ulong *
    1377      436152 : convi(GEN x, long *l)
    1378             : {
    1379      436152 :   long n = nchar2nlong(2 + (long)(NLIMBS(x) * (BITS_IN_LONG * LOG10_2)));
    1380      436152 :   GEN str = cgetg(n+1, t_VECSMALL);
    1381      436152 :   unsigned char *res = (unsigned char*) GSTR(str);
    1382      436152 :   long llz = mpn_get_str(res, 10, LIMBS(icopy(x)), NLIMBS(x));
    1383             :   long lz;
    1384             :   ulong *z;
    1385             :   long i, j;
    1386             :   unsigned char *t;
    1387      436152 :   while (!*res) {res++; llz--;} /*Strip leading zeros*/
    1388      436152 :   lz  = (8+llz)/9;
    1389      436152 :   z = (ulong*)new_chunk(1+lz);
    1390      436152 :   t=res+llz+9;
    1391      865450 :   for(i=0;i<llz-8;i+=9)
    1392             :   {
    1393             :     ulong s;
    1394      429298 :     t-=18;
    1395      429298 :     s=*t++;
    1396     3863682 :     for (j=1; j<9;j++)
    1397     3434384 :       s=10*s+*t++;
    1398      429298 :     *z++=s;
    1399             :   }
    1400      436152 :   if (i<llz)
    1401             :   {
    1402      432221 :     unsigned char *t = res;
    1403      432221 :     ulong s=*t++;
    1404     1223325 :     for (j=i+1; j<llz;j++)
    1405      791104 :       s=10*s+*t++;
    1406      432221 :     *z++=s;
    1407             :   }
    1408      436152 :   *l = lz;
    1409      436152 :   return z;
    1410             : }

Generated by: LCOV version 1.16