为什么要基于sigmoid函数和给定的0.5阈值进行预测呢,这个多分类任务不应该是基于softmax吗?因为有个数据集存在一个span同时属于了两个entity类别,索性就都用了sigmoid。如果我们处理的是特定的领域的都是平面实体,我们使用softmax的话,我们还用对代码中decode里面的内容进行修改吗
为什么要基于sigmoid函数和给定的0.5阈值进行预测呢,这个多分类任务不应该是基于softmax吗?因为有个数据集存在一个span同时属于了两个entity类别,索性就都用了sigmoid。如果我们处理的是特定的领域的都是平面实体,我们使用softmax的话,我们还用对代码中decode里面的内容进行修改吗