update at 2026-03-16 09:00:35

This commit is contained in:
douboer@gmail.com
2026-03-16 09:00:35 +08:00
parent 4b280073d4
commit 3d8dba12aa
24 changed files with 974 additions and 233 deletions

View File

@@ -0,0 +1,317 @@
# Kindle Voyage 5.13.6 白屏/KUAL/SSH 交接文档
本文记录 2026-03-15 这轮 dashboard 调试在后半段进入的异常状态,目标是给下一次接手排障的人一个明确起点,避免继续沿着已经证伪或高风险的路径重复试错。
## 当前交接状态
截至本次更新时,设备不再处于“完全卡死且无法 SSH”的状态而是进入了一个更窄的失败场景
- Kindle 已能回到主页
- `ssh kindle` 已恢复可用
-`KUAL -> Kindle Dashboard` 进入 dashboard 时,仍会复现白屏
- 白屏出现时dashboard 本身往往没有真正接管成功,更像是 `framework/KUAL` 启动链在中途被打断
- 当前最稳定的恢复路径,仍然是通过 SSH 执行 `./stop.sh`
这份文档只记录当前交接结论,不再继续尝试修复。
## 已确认的事实
### 1. `Dashboard Debug On` 已能阻止自动挂起
这部分在设备可连 SSH 时已经实机验证通过:
- [dash/src/debug-on.sh](/Users/gavin/kindle-dash/dash/src/debug-on.sh) 现在会:
-`DISABLE_SYSTEM_SUSPEND=true` 写入 `local/env.sh`
- 自动重启 dashboard
- 日志里已经出现过:
```text
Skipping system suspend, sleeping for 40s instead
```
所以“点 `Dashboard Debug On` 之后 3 秒就休眠”这个问题,本轮已经修住。
### 2. `dashboard` 模式不是可交互界面
当前实现里dashboard 启动后会主动停掉 Kindle 的前台 UI
- [dash/src/dash.sh](/Users/gavin/kindle-dash/dash/src/dash.sh#L50) 调用 `stop_framework`
- [dash/src/dash.sh](/Users/gavin/kindle-dash/dash/src/dash.sh#L51) 停掉 `webreader`
这意味着:
- 进入 dashboard 之后,不应再期望当前屏幕仍然像普通 Kindle 页面那样可点击
- 也不应再期待“从 dashboard 直接返回刚才那个 KUAL 页面”
### 3. 顶栏遮罩不处理触摸
右上角状态栏遮罩逻辑在:
- [dash/src/dash.sh](/Users/gavin/kindle-dash/dash/src/dash.sh#L121)
它只是调用 `fbink` 在帧缓冲上画白色矩形,不负责输入,也不会接管触摸事件。因此:
- “点不到 KUAL” 不是顶栏遮罩造成的
- 真正相关的是 `framework/webreader` 被停掉
### 4. `stop.sh` 现在只负责恢复 UI 栈,不负责直接打开 KUAL
当前 [dash/src/stop.sh](/Users/gavin/kindle-dash/dash/src/stop.sh) 已改成:
- 停掉 `dash.sh`
- 清掉 `preventScreenSaver`
- 启动 `framework`
- 启动 `webreader`
也就是说它的职责是:
- 让 Kindle 回到“应该可以恢复正常 UI”的状态
不是:
- 直接把 KUAL booklet 弹出来
补充一点:在白屏恢复过程中,`stop.sh` 已经比旧版稳定很多,但仍存在一种残留状态:
- `framework``cvm` 已回来了
- `webreader` 可能还停在 `stop/waiting`
这时手工再执行一次 `start webreader`,主页通常就能回来。
### 5. 直接 `booklet run` 的试探命令不安全
本轮为了验证能否从 shell 里直接拉起主页或 KUAL试过两类命令
```sh
lipc-set-prop com.lab126.booklet run "app://com.lab126.booklet.home"
lipc-set-prop com.lab126.booklet run "com.mobileread.ixtab.kindlelauncher.KualBooklet"
```
这条路不稳定,已经触发过 `cvm` 崩溃打包。设备上看到过:
- `/mnt/us/documents/cvm_2886_..._crash_Mar_15_14.14.19_2026.tgz`
- `/mnt/us/documents/cvm_5551_..._crash_Mar_15_14.18.54_2026.tgz`
因此下次接手时,不要再直接复用这两条命令。
### 6. dashboard 本身可以工作,失败更像发生在 KUAL 启动路径
本轮已经验证过:
- 通过 SSH 直接前台运行 `DEBUG=true ./start.sh`dashboard 可以正常渲染
- 时钟、背景图、顶栏遮罩都能按预期执行
- 前台日志里可以看到正常的刷新过程
这说明:
- dashboard 渲染逻辑本身不是当前白屏问题的主因
- 真正未解的是 `KUAL -> start.sh -> dash.sh` 这条非调试、后台化启动路径
### 7. 白屏时,帧缓冲本身就是白的,不是单纯 e-ink 残影
本轮抓过多次 `fbgrab`
- `tmp/current-ui.png`
- `tmp/ui-restart-screen.png`
- `tmp/ui-after-power-cycle.png`
这些截图都是真正的纯白图,不是“系统其实起来了,只是屏幕没刷新”。因此:
- 白屏发生时,不能只从物理屏幕角度判断
- 需要继续围绕 `framework / cvm / webreader / dash.sh` 的实际进程状态排查
### 8. 日志证据表明KUAL 切到 dashboard 的过程中framework 主进程被 TERM
这轮从 `/var/log/messages` 里已经看到关键序列:
- KUAL booklet 被启动
- home booklet 被恢复
- 随后 `framework main process (...) killed by TERM signal`
这说明当前最可疑的点是:
- KUAL 页面触发 dashboard 启动时,父 UI 进程在切换链路中被自己或系统杀掉
- dashboard 又没有在这之前稳定脱离 KUAL 会话
- 结果就是前台白屏,而不是正常切入 dashboard
## 本轮过程中已验证过的有效路径
在问题进一步收敛前,以下链路是验证过可工作的:
### 1. 背景图链路
- 网页导出 `1072x1448``8-bit grayscale PNG`
- Kindle 直接显示这张背景图时,所见即所得
关键文件:
- [calendar/dist/kindlebg.png](/Users/gavin/kindle-dash/calendar/dist/kindlebg.png)
- [dash/src/local/fetch-dashboard.sh](/Users/gavin/kindle-dash/dash/src/local/fetch-dashboard.sh)
### 2. 本机时钟链路
黑块问题已经从“透明 PNG patch”切到“Lua 本机绘制”:
- [dash/src/local/render-clock.lua](/Users/gavin/kindle-dash/dash/src/local/render-clock.lua)
- [dash/src/local/render-clock.sh](/Users/gavin/kindle-dash/dash/src/local/render-clock.sh)
当设备 SSH 正常时,这条链路已经实机验证过:
- 背景正常
- 时钟可叠加
- 不再出现整块黑色 patch
### 3. Wi-Fi SSH 链路
目前仍可用的稳定入口是:
```sh
ssh kindle
```
它依赖本机 `~/.ssh/config` 中的:
- `HostName 192.168.72.3`
- `IdentityFile ~/.ssh/id_ed25519_git`
这一条在本次文档更新时已经恢复。
### 4. 直接从 SSH 前台启动 dashboard
当前唯一明确验证成功的 dashboard 启动方式是:
```sh
ssh kindle 'cd /mnt/us/dashboard && DEBUG=true ./start.sh'
```
这条路径的特点是:
- `dash.sh` 以前台方式运行
- 不依赖 KUAL 页面还活着
- 能直接看到 shell trace 和实时日志
相对地:
- 直接点 `KUAL -> Kindle Dashboard`
- 或通过普通 `./start.sh` 后台起进程
这两条路径目前都没有被证明稳定。
## 当前不要再做的事情
以下路径本轮已经证明风险高或收益低,下次接手前不要重复:
1. 不要再尝试“双击电源键 / 同时按翻页条”呼出 KUAL
- 当前仓库没有任何这类按键绑定实现
- 这条路没有现成机制可用
2. 不要再尝试 `booklet run` 直接拉起主页或 KUAL
- 已触发 `cvm` 崩溃
- 风险高于收益
3. 不要继续走“KUAL -> Dashboard -> 再返回 KUAL”的交互路径
- dashboard 启动后会停掉 `framework/webreader`
- 从逻辑上这就不是一个受支持的返回路径
4. 不要把 `KUAL -> Kindle Dashboard` 当成当前可用入口
- 这正是现在仍会复现白屏的路径
- 问题还没有修住
## 下一次接手的安全起点
下一次恢复排障时,请按这个顺序来:
### A. 先把设备恢复到正常 UI
1. 长按电源键约 40 秒重启
2. 先不要启动 dashboard
3. 先确认能正常回到 Kindle 首页
4. 再确认能正常打开 KUAL
### B. 再确认网络
只有在设备已经稳定回到正常 UI 后,才做这一步:
```sh
ssh kindle
```
如果仍然不通,再查:
- Kindle 是否连回同一个主 Wi-Fi
- IP 是否还是 `192.168.72.3`
- DropBear 是否还在监听 `22`
### C. 重新进入 dashboard 时的推荐方式
恢复后如果还要继续调 dashboard当前建议只走这条路径
```sh
ssh kindle 'cd /mnt/us/dashboard && DEBUG=true ./start.sh'
```
原因:
- 这条路径已经验证成功
- 可以直接看到日志
- 不依赖 KUAL 的 UI 切换链路
退出 dashboard 时:
```sh
ssh kindle 'cd /mnt/us/dashboard && ./stop.sh'
```
等几秒,让 UI 栈恢复,再从 Kindle 首页重新打开 KUAL。
如果执行完 `./stop.sh` 后主页仍然没有回来,再补:
```sh
ssh kindle 'start webreader'
```
不要从 dashboard 页面直接尝试回 KUAL。
### D. 当前真正待修的点
下次接手时,排障目标应该收敛到这一条:
- 为什么 `KUAL -> Kindle Dashboard` 会白屏,而 `ssh kindle 'DEBUG=true ./start.sh'` 却能正常显示
也就是说,重点应该放在:
- KUAL 菜单动作
- `start.sh` 的后台脱离方式
- `framework` 被 TERM 的时机
而不是继续怀疑背景图、时钟绘制或顶栏遮罩。
## 这轮涉及的关键文件
- [dash/src/dash.sh](/Users/gavin/kindle-dash/dash/src/dash.sh)
- [dash/src/start.sh](/Users/gavin/kindle-dash/dash/src/start.sh)
- [dash/src/stop.sh](/Users/gavin/kindle-dash/dash/src/stop.sh)
- [dash/src/debug-on.sh](/Users/gavin/kindle-dash/dash/src/debug-on.sh)
- [dash/src/debug-off.sh](/Users/gavin/kindle-dash/dash/src/debug-off.sh)
- [dash/src/local/env.sh](/Users/gavin/kindle-dash/dash/src/local/env.sh)
- [dash/src/local/render-clock.sh](/Users/gavin/kindle-dash/dash/src/local/render-clock.sh)
- [dash/src/local/render-clock.lua](/Users/gavin/kindle-dash/dash/src/local/render-clock.lua)
- [dash/docs/kindle-voyage-5.13.6-dual-ssh-playbook-zh.md](/Users/gavin/kindle-dash/dash/docs/kindle-voyage-5.13.6-dual-ssh-playbook-zh.md)
## 最后结论
本轮后半段的主要问题已经不是 dashboard 页面本身,而是:
- dashboard 与 Kindle 原生 `framework/KUAL` 的边界切换不稳定
- `KUAL -> Kindle Dashboard` 这条启动链仍会白屏
- 直接用 shell 强拉 booklet 会触发前台 Java 崩溃
因此,当前最重要的不是继续调页面,而是:
1. 保留当前已经可用的 SSH 启动/停止路径
2. 修住 `KUAL -> Kindle Dashboard` 白屏
3. 在不再触发 `cvm` 崩溃的前提下,把“进入 dashboard”和“退出 dashboard”都收敛成稳定流程