图片列表先控内存

很多技术问题看起来是某个 API 用错了，实际更像一次边界没有提前说清的连锁反应。信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图，这种情况并不稀奇：功能表面能跑，真正进入复杂路径后，隐藏假设才开始一个个冒出来。

这篇文章想讨论的不是把图片列表内存讲成一套万能口诀，而是把它放回真实工作里看：哪些规则需要提前定，哪些复杂度可以延后，哪些地方一旦偷懒就会变成排查成本。我的判断是，先把边界收住，再谈抽象、性能或体验，通常更稳。

先确认加载的是多大的图

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，展示 120dp 的缩略图却解码 3000px 原图，是最常见的浪费。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

从机制上看，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：把展示尺寸、请求尺寸和原图尺寸打到调试日志。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：图片库不是魔法，传错尺寸照样浪费内存。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

判断这部分做得好不好，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“先确认加载的是多大的图”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

图里只保留了和图片列表内存直接相关的路径，目的不是画全系统，而是帮助你判断问题应该从哪一层开始拆。

列表复用要处理旧请求

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，ViewHolder 被复用后，旧图片请求如果继续返回，会出现闪图或错图。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

放到“列表复用要处理旧请求”这个小节里看，相关机制并不是背景知识，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：绑定前取消旧请求，绑定时带上当前数据标识。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：只靠 ImageView 最后设置覆盖，弱网下容易露馅。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

在“列表复用要处理旧请求”这里，验收不该只看一句通过，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“列表复用要处理旧请求”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

针对“列表复用要处理旧请求”，可以把检查动作落成三项：

先写清本场景里的关键对象：图片列表内存。

再标出会影响它的机制：解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期。

最后补上失败时的判断标准：长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。

缓存不是越大越好

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，内存缓存太小会频繁解码，太大会挤压页面其他对象。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

放到“缓存不是越大越好”这个小节里看，相关机制并不是背景知识，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：根据页面类型和设备等级设置策略。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：为了命中率盲目加大缓存，可能换来更频繁 GC。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

在“缓存不是越大越好”这里，验收不该只看一句通过，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“缓存不是越大越好”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

换到“缓存不是越大越好”这一步，图里只保留了和图片列表内存直接相关的路径，目的不是画全系统，而是帮助你判断问题应该从哪一层开始拆。

下面这段代码只表达思路，重点不在复制，而在看清边界放在哪里：

// 伪代码：按展示尺寸请求缩略图，而不是原图
load(url).override(itemWidth, itemHeight).into(imageView)

预加载要看滑动速度

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，慢滑可以提前加载下一屏，快速甩动时应该收缩预加载。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

放到“预加载要看滑动速度”这个小节里看，相关机制并不是背景知识，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：根据滚动状态调整预加载窗口。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：固定预加载十屏，会把用户没看的内容也解码进来。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

在“预加载要看滑动速度”这里，验收不该只看一句通过，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“预加载要看滑动速度”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

针对“预加载要看滑动速度”，可以把检查动作落成三项：

先写清本场景里的关键对象：图片列表内存。

在“预加载要看滑动速度”里标出会影响它的机制：解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期。

为“预加载要看滑动速度”补上失败时的判断标准：长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。

换到“预加载要看滑动速度”这一步，图里只保留了和图片列表内存直接相关的路径，目的不是画全系统，而是帮助你判断问题应该从哪一层开始拆。

生命周期决定能不能回收

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，页面退出、Tab 切换、后台恢复都要让请求和缓存策略跟着变化。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

放到“生命周期决定能不能回收”这个小节里看，相关机制并不是背景知识，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：在合适生命周期暂停或清理非关键请求。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：后台还继续加载列表图片，是对电量和内存的双重浪费。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

在“生命周期决定能不能回收”这里，验收不该只看一句通过，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“生命周期决定能不能回收”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

验收要用低端机和长列表

在信息流页面滑动几十屏后开始掉帧，偶尔 OOM，图片库看起来已经接入，但列表里仍在加载远超展示尺寸的原图这个场景里，高端机滑十条没问题，不代表真实用户没问题。这不是写法洁癖，而是决定问题发生时团队能不能快速定位责任边界。图片列表内存如果没有被提前说清，后面的代码、测试和排查都会各自按自己的理解推进。

放到“验收要用低端机和长列表”这个小节里看，相关机制并不是背景知识，解码尺寸、Bitmap 复用、内存缓存、磁盘缓存、预加载和 RecyclerView 生命周期不是孤立存在的。它们会在一次真实请求、一次页面切换或一次批处理任务里互相影响。理解这一层之后，就能看出为什么预加载能减少等待，但过度预加载会挤占内存并拖慢回收。

落地时建议先做一件小事：用低内存设备连续滑动、切后台、返回再滑。这个动作看起来慢，却能把隐藏分歧提前暴露出来。很多线上问题不是因为团队不会写代码，而是因为大家默认的边界根本不是同一个。

这里最容易踩的坑是：只看首次进入性能，会漏掉累积型内存问题。它通常不会在第一天爆炸，而是在数据量变大、用户路径变复杂、或者某个下游服务变慢时突然出现。到那时再补规则，成本会高很多。

在“验收要用低端机和长列表”这里，验收不该只看一句通过，不要只看功能是否跑通，而要看长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸。如果答案仍然含糊，说明设计还停留在感觉层面，需要继续把条件、异常和责任写具体。

在“验收要用低端机和长列表”这一段里，我更愿意把复杂度摊开放到日志、状态和验收规则里，而不是塞进默认行为。这样做不一定显得聪明，但后续排查会更稳：谁触发、谁处理、失败后谁接手，都能在材料里找到依据。

收尾时看这三个信号

第一，看问题能不能被命名。比如这篇里的核心不是泛泛的“优化一下”，而是图片列表内存有没有清楚边界。能命名的问题，才容易进入评审、测试和复盘。

第二，看失败能不能被复现。围绕长列表快速滑动后内存水位可回落，图片尺寸接近展示尺寸设计一组小样本，比等线上偶发问题更可靠。样本不需要复杂，但要覆盖正常、异常、边界和恢复。

第三，看团队能不能做出一致选择。预加载能减少等待，但过度预加载会挤占内存并拖慢回收，这类取舍没有绝对答案，但必须有理由、有记录、有回滚空间。否则今天靠经验放过的点，明天就会变成另一个人看不懂的坑。

真正有价值的工程文章，不是把每个概念都讲满，而是帮读者在下次遇到类似场景时更早地停一下：这件事的边界定了吗，失败路径想过了吗，验收标准能说清吗。只要这三个问题能回答，很多复杂度就已经少了一半。

探客时代

图片列表先控内存