Skip to content

Latest commit

 

History

History
22 lines (19 loc) · 973 Bytes

File metadata and controls

22 lines (19 loc) · 973 Bytes

工作进度与安排

20190904

待完成工作:

  • 多卡并行
    • [进行中]与沃老师协商Slurm集群分区限制
    • [已完成]多卡Demo
    • [已完成]多卡模型修改
      • 训练√
      • 测试√
    • [已完成]测试batch_size和训练速度:batch_size=48, CNN DAILY数据集250个Batch 332s,一天约10.8个Epoch
  • 解码
    • [待决定]减小验证集(测试集)数量,可能留取10%数据用于平时测试,最终对比较好的ckpt用完整数据测一下最终结果
    • [待决定]提前结束预测(可能需要debug一下,排除错误)
    • [已完成]将Encoder和Decoder分开进行,先跑一遍Encoder得到输出,然后只跑Decoder依次得到完整摘要
    • [进行中]训练和测试分开进行,训练时仅生成ckpt不测试。
    • [已完成]多卡并行测试
  • 模型
    • layer-aligned Transformer
    • bug fix: 从ckpt导入参数时,不排除optimization中的参数