Add File

2025-09-04 14:09:21 +08:00
parent 88850a03f3
commit 8affb1fdbe
1 changed files with 179 additions and 0 deletions
--- a/src/main/java/org/dromara/easyai/transFormer/CodecBlock.java
+++ b/src/main/java/org/dromara/easyai/transFormer/CodecBlock.java
@@ -0,0 +1,179 @@
 package org.dromara.easyai.transFormer;
 import org.dromara.easyai.function.ReLu;
 import org.dromara.easyai.i.OutBack;
 import org.dromara.easyai.matrixTools.Matrix;
 import org.dromara.easyai.matrixTools.MatrixOperation;
 import org.dromara.easyai.transFormer.model.CodecBlockModel;
 import org.dromara.easyai.transFormer.nerve.HiddenNerve;
 import org.dromara.easyai.transFormer.nerve.Nerve;
 import org.dromara.easyai.transFormer.seflAttention.LayNorm;
 import org.dromara.easyai.transFormer.seflAttention.MultiSelfAttention;
 import java.util.ArrayList;
 import java.util.HashMap;
 import java.util.List;
 import java.util.Map;
 public class CodecBlock {
    private final MultiSelfAttention multiSelfAttention;
    private final LayNorm attentionLayNorm;//注意力层残差归一化
    private final List<HiddenNerve> fistHiddenNerves = new ArrayList<>();//线性层第一层
    private final List<HiddenNerve> secondHiddenNerves = new ArrayList<>();//线性层第二层
    private final LayNorm lineLayNorm;//线性层残差归一化
    private final TransWordVector transWordVector;//内置词向量
    ////////////////////////////////////
    private CodecBlock afterEncoderBlock;//后编码模块
    private CodecBlock beforeEncoderBlock;//前编码模块
    private CodecBlock lastEncoderBlock;//最后一层编码器
    private final Map<Long, Matrix> outMatrixMap = new HashMap<>();
    private final boolean encoder;//是否为编码器
    private LineBlock lineBlock;//解码器最后的线性分类器
    private FirstDecoderBlock firstDecoderBlock;//解码器第一层
    private final MatrixOperation matrixOperation;
    private final int coreNumber;
    public CodecBlockModel getModel() throws Exception {
        List<float[][]> firstNerveModel = new ArrayList<>();
        List<float[][]> secondNerveModel = new ArrayList<>();
        for (int i = 0; i < fistHiddenNerves.size(); i++) {
            firstNerveModel.add(fistHiddenNerves.get(i).getModel());
            secondNerveModel.add(secondHiddenNerves.get(i).getModel());
        }
        CodecBlockModel codecBlockModel = new CodecBlockModel();
        codecBlockModel.setMultiSelfAttentionModel(multiSelfAttention.getModel());
        codecBlockModel.setAttentionLayNormModel(attentionLayNorm.getModel());
        codecBlockModel.setFistNervesModel(firstNerveModel);
        codecBlockModel.setSecondNervesModel(secondNerveModel);
        codecBlockModel.setLineLayNormModel(lineLayNorm.getModel());
        return codecBlockModel;
    }
    public void insertModel(CodecBlockModel codecBlockModel) throws Exception {
        multiSelfAttention.insertModel(codecBlockModel.getMultiSelfAttentionModel());
        attentionLayNorm.insertModel(codecBlockModel.getAttentionLayNormModel());
        List<float[][]> firstNerveModel = codecBlockModel.getFistNervesModel();
        List<float[][]> secondNerveModel = codecBlockModel.getSecondNervesModel();
        for (int i = 0; i < fistHiddenNerves.size(); i++) {
            fistHiddenNerves.get(i).insertModel(firstNerveModel.get(i));
            secondHiddenNerves.get(i).insertModel(secondNerveModel.get(i));
        }
        lineLayNorm.insertModel(codecBlockModel.getLineLayNormModel());
    }
    public void setFirstDecoderBlock(FirstDecoderBlock firstDecoderBlock) {
        this.firstDecoderBlock = firstDecoderBlock;
    }
    public void setLineBlock(LineBlock lineBlock) {
        this.lineBlock = lineBlock;
    }
    public void setLastEncoderBlock(CodecBlock lastEncoderBlock) {
        this.lastEncoderBlock = lastEncoderBlock;
    }
    public void setAfterEncoderBlock(CodecBlock afterEncoderBlock) {
        this.afterEncoderBlock = afterEncoderBlock;
    }
    public void setBeforeEncoderBlock(CodecBlock beforeEncoderBlock) {
        this.beforeEncoderBlock = beforeEncoderBlock;
    }
    public CodecBlock(int multiNumber, int featureDimension, float studyPoint, int depth,
                      boolean encoder, int regularModel, float regular, int coreNumber, TransWordVector transWordVector) throws Exception {//进行初始化
        matrixOperation = new MatrixOperation(coreNumber);
        this.encoder = encoder;
        this.transWordVector = transWordVector;
        this.coreNumber = coreNumber;
        attentionLayNorm = new LayNorm(1, featureDimension, this, null, studyPoint, coreNumber, encoder, depth);
        lineLayNorm = new LayNorm(2, featureDimension, this, null, studyPoint, coreNumber, encoder, depth);
        multiSelfAttention = new MultiSelfAttention(multiNumber, studyPoint, depth, featureDimension, encoder, this, coreNumber,
                null);
        multiSelfAttention.setLayNorm(attentionLayNorm);
        attentionLayNorm.setMultiSelfAttention(multiSelfAttention);
        initLine(featureDimension, studyPoint, regularModel, regular);
        attentionLayNorm.setHiddenNerves(fistHiddenNerves);
        lineLayNorm.setHiddenNerves(secondHiddenNerves);
    }
    public void backError(long eventID, Matrix errorMatrix) throws Exception {//最后线性层返回误差
        lineLayNorm.backErrorFromLine(errorMatrix, eventID);
    }
    public void removeOutMatrix(long eventID) {
        outMatrixMap.remove(eventID);
    }
    public Matrix getOutMatrix(long eventID) {
        return outMatrixMap.get(eventID);
    }
    public void sendOutputMatrix(long eventID, Matrix out, boolean isStudy, OutBack outBack,
                                 List<Integer> E, Matrix encoderFeature, boolean outAllPro) throws Exception {//参数正向出口
        if (beforeEncoderBlock != null) {
            beforeEncoderBlock.sendInputMatrix(eventID, out, isStudy, outBack, E, encoderFeature, outAllPro);
        } else if (encoder) {//编码器走到末尾 保存输出矩阵
            outMatrixMap.put(eventID, out);
        } else {//解码器走到头了 输出线性分类层
            lineBlock.sendParameter(eventID, out, isStudy, outBack, E, outAllPro);
        }
    }
    public void backCodecError(Matrix errorMatrix, long eventID, Matrix allFeature) throws Exception {//本层最终误差返回
        Matrix error = matrixOperation.add(errorMatrix, allFeature);
        if (afterEncoderBlock != null) {
            afterEncoderBlock.backError(eventID, error);
        } else if (firstDecoderBlock != null) {//将误差反给第一层解码器
            firstDecoderBlock.backError(eventID, error);
        } else {//返回给词向量
            transWordVector.backEncoderError(error);
        }
    }
    public void backLastEncoderError(Matrix error) throws Exception {//给最后一层编码器返回误差
        lastEncoderBlock.backLastError(error);
    }
    private void backLastError(Matrix error) throws Exception {//最后一层编码器接收error
        lineLayNorm.backLastError(error);
    }
    public void encoderBackStart(long eventID) throws Exception {//给最后一层编码器发送back指令
        lineLayNorm.encoderBackStart(eventID);
    }
    //Encoder 参数正向入口
    public void sendInputMatrix(long eventID, Matrix feature, boolean isStudy, OutBack outBack, List<Integer> E
            , Matrix encoderFeature, boolean outAllPro) throws Exception {
        multiSelfAttention.sendMatrixMessage(eventID, feature, isStudy, outBack, E, encoderFeature, outAllPro);
    }
    private void initLine(int featureDimension, float studyPoint, int regularModel, float regular) throws Exception {
        List<Nerve> firstNerves = new ArrayList<>();
        List<Nerve> secondNerves = new ArrayList<>();
        for (int i = 0; i < featureDimension; i++) {
            HiddenNerve hiddenNerve1 = new HiddenNerve(i + 1, 1, studyPoint, new ReLu(), featureDimension,
                    featureDimension, null, regularModel, regular, coreNumber);
            fistHiddenNerves.add(hiddenNerve1);
            hiddenNerve1.setAfterLayNorm(attentionLayNorm);
            firstNerves.add(hiddenNerve1);
        }
        for (int i = 0; i < featureDimension; i++) {
            HiddenNerve hiddenNerve2 = new HiddenNerve(i + 1, 2, studyPoint, null,
                    featureDimension, 1, null, regularModel, regular, coreNumber);
            hiddenNerve2.setBeforeLayNorm(lineLayNorm);
            secondHiddenNerves.add(hiddenNerve2);
            secondNerves.add(hiddenNerve2);
        }
        for (Nerve hiddenNerve : firstNerves) {
            hiddenNerve.connect(secondNerves);
        }
        for (Nerve hiddenNerve : secondNerves) {
            hiddenNerve.connectFather(firstNerves);
        }
    }
 }