Infos sur la Vampire (suite)

4 sujets de 931 à 934 (sur un total de 934)

  • __sam__

    • Messages : 2575
    #347469

    Sam faisait même une mini compète avec lui pour démontrer qu’une version soft sous UAE était au moins aussi rapide que la version hard de Gunnar sous Vampire. Du coup, je crois que Gunnar a amélioré son truc pour fonctionner en 24 bits.[/Quote]
    non les 2 versions sont équivalentes en fonctionnalités. C’est du 3*8 bits partout. En AMMX ca prend 1 cycle, et en 680×0 ca prends quelques dizaines de cycles (je crois, de mémoire). Ca ne change pas grand chose car c’est pas là qu’on perds du temps au final.
    [quote]Qu’est-ce qu’il en est aujourd’hui?

    Ben c’est pas utilisé à part dans dans ma démo de nouvelle année de l’époque :-/

    En même temps c’est pas mal contraint: il faut une texture d’exactement 256×256 pixels dans le format adapté qu’aucun jeu n’utilise, et surtout c’est pas là que la 3D perds du temps CPU. Elle perds du temps CPU dans les bulles des unités flottantes car les compilos ont vraiment un mal de chien à bien organiser les calculs pour optimiser les pipelines FPU et entiers 1&2.

    Perso ce qui aiderait serait d’avoir une opération FMA (mutliply-accumulate operation: fp0 += fp1*fp2). Cela permettrait d’accélérer massivement les opérations élémentaires de la 3D qui sont un peu plus complexes que les opérations arithmétiques de bases. Or il n’en veut pas ajouter de FMA. C’est vrai que c’est pas (A)MMX mais que ca vient originellement des PowerPC, et là dessus, ben il coince. C’est carrément con, car le standard C de 1999 qui est maintenant largement répandu partout introduit cette opération dans le langage lui-même pour vraiment aider les compilos à faire du code qui boost et qui soit portable.


    @Alain
    il me semble que Gunnar a bossé dans la division GPU de ibm. En fait il connait bien la 3D, mais probablement qu’il ne peut pas réutiliser tout ce qu’il sait pour des raisons de propriétés intellectuelles (d’où peut être les frein sur le FMA). Du coup il laisse croire aux développeurs que c’est à eux de tout faire en soft au niveau de la 3D et que lui ne fournit que les opérations rapide d’accès aux données (genre décompression pixel), mais pas les calculs. Or en C les claculs sont c’est 5x trop lent (à cause des pipelines mal gérés), et en ASM c’est chiant à faire (je sais, je l’ai fait pour quake) et toujours sous-optimal quand c’est du code « générique ». Bon peut-être qu’il va changer. Apparemment ya un type qui dit faire un jeu 3D spécial vampire. Si le truc a du succès et que son auteur demande des primitives de calcul flottant adaptées ca peut le motiver…

    Samuel.

    Amiga A500 + GVP530 (8Mo/fpu/mmu/scsi) - en panne
    A1200 (Blizzard-IV/fpu/64Mo) - A500 (+ 1Mo PPS) - A500 Vampire V2+ ^8^
    (mais aussi TO8 - TO8D - TO9. Groupe PULS.)

    seg

    • Messages : 1134
    #347505

    @__sam__

    Perso ce qui aiderait serait d’avoir une opération FMA (mutliply-accumulate operation: fp0 += fp1*fp2).

    Ça c’est très bien effectivement.
    Mais est-ce qu’il ne vaudrait pas mieux une petite unité matricielle améliorée. Genre, un truc qui rotate et qui plaque en une instruction?
    Quant au scanline, je suis convaincu qu’une version hard serait très intéressante, dans la mesure où elle ferait plus qu’un bête mapping 2D à la PS1. Ça peut être une fonctionnalité étendue du blitter.

    __sam__

    • Messages : 2575
    #347539

    Plus tu fais de choses en un cycles, plus ca bouffe de la place sur le FPGA et plus ca rend la compilation difficile (pbs de timings). Bref une unité matricielle c’est « overkill ».

    Déjà ajoutons les instructions manquantes au 68k et qui boost sur les autres cpu et yen a plein avec le fma, c’est clairement pas une instruction anecdotique. Je suis meme prêt à sacrifier pleins d’instructions AMMX que personne n’utilise pour un FMA même pas parallèle.

    Samuel.

    Amiga A500 + GVP530 (8Mo/fpu/mmu/scsi) - en panne
    A1200 (Blizzard-IV/fpu/64Mo) - A500 (+ 1Mo PPS) - A500 Vampire V2+ ^8^
    (mais aussi TO8 - TO8D - TO9. Groupe PULS.)

    __sam__

    • Messages : 2575
    #347589

    A propos de ce qu’il existe ailleurs et qui apporte vraiment du boost en puissance de calcul:

    Avec un FMA parallèle, mandel devrait être « a piece of cake ».

    Samuel.

    Amiga A500 + GVP530 (8Mo/fpu/mmu/scsi) - en panne
    A1200 (Blizzard-IV/fpu/64Mo) - A500 (+ 1Mo PPS) - A500 Vampire V2+ ^8^
    (mais aussi TO8 - TO8D - TO9. Groupe PULS.)

4 sujets de 931 à 934 (sur un total de 934)

  • Vous devez être connecté pour répondre à ce sujet.

Forums AmigaOS, MorphOS et AROS Matériel Infos sur la Vampire (suite)

Do NOT follow this link or you will be banned from the site!