逆推德尔菲专家数据生成

方法概述

逆推德尔菲专家数据生成（Delphi Backstepping）是传统德尔菲法的逆向应用。传统德尔菲法通过多轮专家咨询，使专家意见趋于一致，最终得到满足一致性要求的评价结果。而逆推德尔菲法则根据用户预先设定的一致性阈值（肯德尔和谐系数、均值、满分频率等），自动生成一组模拟专家打分数据，使得对该数据集进行德尔菲分析后，各项指标恰好满足用户的要求。

该工具的核心价值在于：

教学演示：快速生成符合特定一致性水平的德尔菲数据，用于方法教学。
阈值验证：检验不同阈值组合下模拟数据的可生成性，辅助研究者理解指标筛选的严格程度。
算法测试：为德尔菲分析算法提供标准化的测试数据集。

计算步骤

1. 设置生成参数

用户需指定以下参数：

指标数量 \(m\)（2‑200 个）
专家数量 \(n\)（2‑500 名）
打分范围：最小值 \(L\)，最大值（满分）\(U\)（通常为 1‑10 分制）
目标阈值：
- 肯德尔和谐系数下限 \(W_{min}\)
- 各指标平均值下限 \(\bar{x}_{min}\)
- 各指标满分频率下限 \(f_{min}\)（满分定义为 \(U\)）
随机种子（保证结果可复现）

2. 生成基础打分趋势

为每个指标生成基础重要性值：

生成 \(m\) 个 \((0,1)\) 均匀随机数，排序后等间距映射到 \([0,1]\)，得到重要性向量 \(p_j\)。
基础得分 \(s_j^{(base)} = L + p_j \cdot (U - L)\)。该步骤确保指标间有内在区分度（重要性高的指标预期得分更高）。

3. 生成带专家偏好的打分矩阵

对每位专家 \(i\) 和每个指标 \(j\)：

生成专家个体偏移 \(b_i \sim N(0, \sigma_{expert})\)（默认 \(\sigma_{expert}=0.5\)）
生成独立随机噪声 \(e_{ij} \sim N(0, \sigma_{noise})\)（默认 \(\sigma_{noise}=0.2\)）
计算原始值：\(x_{ij}^{(raw)} = s_j^{(base)} + b_i + e_{ij}\)
四舍五入并截断到 \([L, U]\) 整数。

该步骤使得专家间评分存在一致性（通过共享的 \(s_j^{(base)}\)）和个体差异（偏移 + 噪声），从而产生适中的肯德尔和谐系数（通常 0.3‑0.7）。

4. 调整平均值使其达标

若某指标 \(j\) 的当前均值 \(\bar{x}_j < \bar{x}_{min}\)，则反复随机选择一位尚未打到满分的专家，将其该指标分数增加 1 分（但不超过 \(U\)），直至均值达标或无法继续提升。
该操作强制提升低分指标的整体水平。

5. 调整满分频率使其达标

计算每个指标当前满分的专家人数 \(c_j\)。若 \(c_j / n < f_{min}\)，则从非满分专家中随机抽取所需数量的专家，将其该指标分数直接设为 \(U\)。
该操作确保有足够多的专家认为该指标极其重要。

6. 验证肯德尔和谐系数

对调整后的打分矩阵计算每个指标的重要性排名（按分数降序），然后计算肯德尔和谐系数 \(W\)。若 \(W \ge W_{min}\)，则生成成功；否则丢弃该次尝试，重新从步骤 2 开始。

7. 重试机制

最多尝试 \(T\) 次（默认 500 次）。若成功，则返回数据；若失败，返回最后一次生成的数据，并给出警告（可能存在部分阈值不满足）。

案例分析

应用场景：某教师希望生成一组德尔菲模拟数据用于课堂演示，要求 5 个指标、10 位专家、打分 1‑10 分，并满足：

肯德尔和谐系数 \(W \ge 0.4\)（中等一致性）
各指标平均值 \(\ge 6.0\)
各指标满分频率（10 分）\(\ge 20\%\)

参数设置： - 指标数 = 5，专家数 = 10 - 打分范围 = 1～10 - \(W_{min} = 0.4\)，\(\bar{x}_{min} = 6.0\)，\(f_{min} = 0.2\)

生成结果（示例）：系统在第 23 次尝试成功生成数据（种子固定后复现）。生成的部分打分矩阵如下：

专家	指标1	指标2	指标3	指标4	指标5
专家1	8	7	10	6	9
专家2	7	6	9	5	8
…	…	…	…	…	…
专家10	9	7	10	6	9

德尔菲分析结果： - 肯德尔 \(W = 0.46\)（通过） - 各指标均值：7.2, 6.5, 9.1, 5.8, 8.0（指标4略低于6.0，但调整过程中可能因其他条件冲突而未能完美达标，系统会发出警告） - 各指标满分频率：30%, 10%, 60%, 10%, 20%（指标2和4未达20%，同样警告）

教师可据此解释：当多个硬性阈值同时要求时，可能无法完美满足所有条件，需适当放宽或手动干预。

常见问题

Q1: 为什么有时候无法生成完全满足所有阈值的数据？
A: 阈值组合可能存在内在矛盾。例如，要求均值高同时满分频率高，但肯德尔W也要求很高，三者可能冲突。工具会尽力调整，但若500次尝试后仍不满足，会返回最后一次结果并给出警告。建议降低某个阈值（尤其是满分频率或肯德尔W）后重试。

Q2: 生成的分数是否总是整数？
A: 是的。调整步骤中所有的增减操作均以 1 分为单位，确保最终数据为整数，符合实际德尔菲调查中常见的整数打分习惯。

Q3: 能否保证生成的肯德尔W精确等于设定的阈值？
A: 不能。工具保证 \(W \ge W_{min}\)，但不保证恰好等于阈值。这是因为打分矩阵为离散整数，无法连续调节。

Q4: 生成的指标之间是否存在相关性？
A: 生成算法通过基础重要性 \(p_j\) 建立了指标间的内在差异，并通过专家偏移和噪声引入了随机性，因此指标间具有一定的相关性，但非固定结构。

Q5: 如何提高生成成功率？
A: 适当降低 \(W_{min}\) 或 \(f_{min}\)，增加重试次数（可修改代码中的 max_attempts），或增加专家人数（\(n\) 越大，统计量越稳定）。

平台功能

参数设置

指标数量（2‑200）
专家数量（2‑500）
打分最小值（0‑100）、最大值（满分，必须大于最小值）
肯德尔和谐系数阈值（0‑1）
平均值阈值（必须在打分范围内）
满分频率阈值（0‑1）
随机种子（用于结果复现）
结果小数位数（1‑10）

核心功能

一键生成模拟数据并自动进行德尔菲分析
实时显示生成状态（成功/失败/尝试次数）
展示生成的数据表（前20行，可滚动）
提供完整的德尔菲分析结果选项卡：
- 肯德尔和谐系数（W、卡方、P值、排名和离差平方和、相同排名修正因子）
- 一致性文字解释（极低/较低/中等/较高/高度一致）
- 专家排名矩阵
- 评价指标筛选界值（各统计量的界值计算公式、均值/标准差、最终界值）
- 专家意见集中程度（各指标的均值、标准差、变异系数、满分频率、三项判断及综合判断）
- 原始打分数据
- 可视化：指标平均得分柱状图（颜色区分保留/综合取舍/删除）、专家排名热图

AI 智能分析

调用 DeepSeek 大模型自动解读生成数据的质量、是否满足阈值、以及各指标筛选建议（每日限3次）
用户可自定义分析提示词

报告下载

下载生成的数据（CSV）
下载 Excel 报告（包含生成的数据、肯德尔系数表、专家意见集中程度表）
下载 HTML 报告（格式精简，适合存档）

使用建议

合理设置阈值
肯德尔和谐系数通常 0.3‑0.5 为中等一致性，0.5‑0.7 较高，0.7 以上很少在首次模拟中达成。满分频率阈值不宜 >0.5（否则要求半数以上专家打满分），平均值阈值不宜过高（如接近满分）。
多次尝试以获得满意结果
若首次生成失败，可微调阈值或更改随机种子，往往能成功。若始终失败，可查看最后一次生成的数据的各指标均值、满分频率、肯德尔W，了解与目标阈值的差距。
用于教学演示时
建议先生成一组“理想”数据（阈值相对宽松），再生成一组“较差”数据（阈值较高且难以达成），以此展示德尔菲法筛选指标的过程。
与真实德尔菲研究结合
本工具生成的数据不能替代真实专家调查，但可以作为预研工具，帮助研究者估算需要多少专家、多高的阈值才能得到一致结果。

平台界面

官方地址：https://superr.online

平台界面包含：参数设置区域（指标数、专家数、阈值等）、生成按钮、生成数据预览表格、德尔菲分析多选项卡结果、可视化图表及AI分析模块

参考文献

Dalkey, N., & Helmer, O. (1963). An experimental application of the Delphi method to the use of experts. Management Science, 9(3), 458‑467.
徐蔼婷. 德尔菲法的应用及其难点[J]. 统计与决策, 2006(9): 118‑119.
Kendall, M. G., & Babington Smith, B. (1939). The problem of m rankings. The Annals of Mathematical Statistics, 10(3), 275‑287.