概述
可用性工程(Usability Engineering)是一套系统化的方法,用于确保产品达到预定的可用性目标。它遵循 ISO 9241-11 标准中定义的可用性框架。
可用性的定义
根据 ISO 9421 标准,可用性指:
特定用户在特定使用情境下使用产品实现特定目标的有效性、效率和满意度程度。
三个核心维度:
- 有效性:用户完成任务的准确性
- 效率:完成任务所需的资源
- 满意度:用户对系统的正面态度
可用性工程生命周期
┌──────────────────────────────────────────────────────────────┐
│ 可用性工程生命周期 │
├──────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 了解用户 │───▶│ 明确需求 │───▶│ 设计方案 │───▶│ 评估设计 │ │
│ └─────────┘ └─────────┘ └─────────┘ └─────────┘ │
│ ▲ │ │
│ │ 迭代改进 ▼ │
│ └────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────────────┘
阶段一:了解用户
用户研究方法
| 方法 | 目的 | 数据类型 |
|---|---|---|
| 用户访谈 | 了解用户需求、目标和痛点 | 定性 |
| 问卷调查 | 收集大样本用户意见 | 定量/定性 |
| 情境访谈 | 观察用户在实际环境中的行为 | 定性 |
| 卡片分类 | 了解用户的信息组织 mental model | 定量/定性 |
| 日志分析 | 了解现有系统的实际使用模式 | 定量 |
用户建模
创建典型用户画像(Persona):
┌─────────────────────────────────────────────────┐
│ 用户画像示例 │
├─────────────────────────────────────────────────┤
│ 姓名:张明 │
│ 角色:数据分析师 │
│ 目标:快速生成报表、共享发现 │
│ 技术水平:中级 Excel,高级 SQL │
│ 痛点:手动整理数据耗时、易出错 │
└─────────────────────────────────────────────────┘
阶段二:明确用户需求
可用性目标
制定具体、可衡量的目标:
| 目标类型 | 示例 |
|---|---|
| 有效性 | 90% 的用户能在一分钟内完成订单提交 |
| 效率 | 任务完成时间减少 30% |
| 满意度 | SUS 评分达到 75 分以上 |
| 可访问性 | 符合 WCAG 2.1 AA 标准 |
用户需求规格
将用户需求转化为系统需求:
用户需求 → 系统需求 → 可测试指标
"我希望快速找到需要的商品"
→ "搜索结果应在 2 秒内显示"
→ "搜索延迟 < 2s(可测量)"
阶段三:设计方案
原型方法
| 原型类型 | 保真度 | 用途 |
|---|---|---|
| 纸质原型 | 低 | 早期概念验证 |
| 线框图 | 低-中 | 布局和流程 |
| 高保真原型 | 高 | 最终方案验证 |
设计原则
遵循已确立的设计原则:
- 一致性:界面元素行为一致
- 反馈:操作结果及时可见
- 约束:限制用户可能的错误操作
- 可供性:元素外观暗示其用法
阶段四:评估设计
可用性测试类型
形成性可用性测试
目的:在开发过程中发现并修复问题
特点:
- 小样本(5-10 名用户)
- 迭代式
- 发现问题为主
用户测试 → 发现问题 → 修改设计 → 再次测试
总结性可用性测试
目的:验证是否达到预定的可用性目标
特点:
- 大样本(20+ 用户)
- 最终验证
- 量化指标为主
测试流程
1. 准备阶段
├── 定义测试任务
├── 招募参与者
├── 准备测试材料
└── 设置测试环境
2. 执行阶段
├── 欢迎和介绍
├── 预测试问卷
├── 执行任务
├── 实时观察记录
└── 后测试问卷
3. 分析阶段
├── 数据整理
├── 问题归类
├── 严重程度评级
└── 编写报告
评估指标
| 指标 | 说明 | 收集方法 |
|---|---|---|
| 任务完成率 | 用户成功完成任务的百分比 | 观察记录 |
| 任务时间 | 完成任务的时长 | 计时 |
| 错误次数 | 操作错误的次数 | 观察记录 |
| 系统可用性量表(SUS) | 综合可用性评分 | 问卷 |
| 任务负荷指数(NASA-TLX) | 认知负荷测量 | 问卷 |
系统可用性量表(SUS)
10 项问卷,5 分制,生成 0-100 的评分:
| SUS 分数 | 评价 |
|---|---|
| > 80 | 优秀 |
| 68-80 | 良好 |
| < 68 | 需要改进 |
问题严重程度评级
| 等级 | 标准 |
|---|---|
| 严重 | 导致任务失败,无法继续 |
| 主要 | 导致显著困难,但可恢复 |
| 次要 | 美观或小的不便 |
专家评审方法
启发式评估
由可用性专家根据 Nielsen 的十大启发式原则评估界面:
- 选择 3-5 名评估者
- 独立进行评估
- 汇总发现
- 优先级排序
认知走查法
模拟用户逐步完成任务的认知过程:
对于每一步操作:
1. 用户是否有明确的目标?
2. 用户是否知道下一步做什么?
3. 操作是否可识别?
4. 用户是否能获得反馈?
5. 用户是否能从错误中恢复?
多变体分析
同时评估界面的多个变体,通过用户测试比较效果。
可用性报告
报告结构
1. 执行摘要
2. 研究背景和方法
3. 参与者信息
4. 主要发现
├── 问题列表(按严重程度排序)
└── 正面发现
5. 建议
6. 附录
├── 原始数据
├── 问卷结果
└── 测试材料
问题描述模板
问题 #N:[简短描述]
严重程度:[严重/主要/次要]
位置:[界面位置]
描述:[详细说明]
建议:[改进方案]
迭代设计
可用性工程是迭代过程:
设计 → 评估 → 分析 → 改进 → 再设计 → 再评估
每次迭代应:
- 聚焦于最重要的问题
- 设置明确的改进目标
- 记录变更理由
- 验证改进效果