时间分段之后的预分析结果,比她预想的干净。
乔予安把那份重新处理过的数据在周末整理完,那个异常的地区,剔掉政策定义密集变更的三年之后,可及性和实用性之间的缺口缩小了大约三分之一,但还剩下三分之二,那剩下的三分之二是真实的——不是统计噪声,是那个地方的孩子们真的获取了某种资源,但真的没有用起来,或者没有用好。
她在那张结果表格上标了两个颜色:一个颜色是统计人为造成的缺口,已经被剔掉了;另一个颜色是真实的缺口,还在。
然后她在那个"真实缺口"的旁边加了一行字:**需要知道为什么。数字说了有缺口,但没有说为什么。**
这是下一步的问题,不是这一份预分析能回答的,要去问人。
她把这份报告整理成了一个可以在小组会议上讲的版本,把那两个颜色的意义写清楚,把方法论的步骤写清楚,然后在最后一页列了一个建议:下一步追加对该地区一个特定年份样本的定性访谈,建议聚焦在政策变化时间窗口内刚好入学的那一批孩子,因为他们的经历恰好跨越了定义变动前后,最能说明那个真实缺口是怎么形成的。
---
项目组那次讨论会约在周二下午三点。
许宁说没课,问能不能跟着去,乔予安说行,两个人提前了二十分钟到那个校区,找到教学楼里的讨论间,组里其他几个人陆续进来,负责人把这次会议的主题定了:讨论第二期调研工具的指标方案。
乔予安把那份准备好的内容简要说了一遍,着重讲了两件事:第一,两层指标分别测什么,为什么要分;第二,那个异常地区的数据说明了什么,下一步应该怎么办。
她在讲的时候没有用太多术语,尽量把每一步的逻辑说清楚,从"我们想回答的问题"出发,然后说"为了回答这个问题需要什么样的数据",然后说"我们现有的指标能不能提供这种数据",最后说"不能的地方要怎么改"。
讨论室里,那个做数据分析的成员——上两次他都是先有保留后来接受——这次在她讲到第二层指标"实用性"的时候,抬起手打断了一下,"实用性这个维度,你是准备怎么操作化的?'用起来了'这件事,你怎么测?"
这是一个他提了但之前没有具体谈过的问题。乔予安想了一下,"用两种方式,一种是行为指标,比如孩子实际参与了某类资源提供的活动的次数;一种是感知指标,让被访的监护人和孩子本人都说,他们觉得那个资源有没有帮到他们。两种方式结果对照,行为上用了但感知上没有帮助的,算有获取但低实用;两种都没有的,算低获取低实用。"
那个成员,"感知指标的主观性太强了,不同的家庭对'有没有帮助'的判断差异很大,这个变量怎么控制?"
乔予安停了一下,"这个问题我承认没有完全解决,"她说,语气是平的,不是在防御,是在说一件她知道是真的事,"感知变量的主观性是一个真实的方法论限制,现阶段我的处理方式是做亚组比较——把背景相似的家庭放在一起看,在组内做对比,而不是全样本横向比较,这样可以把一部分的背景差异控制掉。但这个方法不完美,如果你有更好的处理方式,我愿意听。"
讨论室里停了一会儿。
那个成员往后靠了靠,"亚组比较是一个合理的折中,但你要在报告里把这个限制写明白,不能让读者以为感知指标是客观测量。"
"这个我会写,"乔予安说,"每一个指标的操作定义和测量限制,我打算在方法论部分单独列一节,写清楚每一种指标能说什么、不能说什么。"
负责人在桌边点了一下头,说,"这个做法是对的,把局限写进去比藏起来要诚实,也更经得起审查。"
讨论往下走,到了下一期访谈对象的样本选择问题,乔予安提了她那个建议——聚焦政策变化时间窗口内入学的那批孩子——负责人想了一下,说"这个逻辑是通的,但联系那一批样本需要通过学校,我们要确认渠道还不还通",乔予安说她可以先把那个地区近几年的学籍数据里那个年份的入学数量统计出来,给负责人一个样本量的估算,负责人说行。
会议在一个小时后结束,她带着一个新的具体任务回来了:统计那个年份的入学数量,提供样本量估算。
---
出了楼,许宁走在她旁边,走了一段,没有立刻说话。
乔予安,"你今天没有说话。"
"我在看,"许宁说,"有一件事我想跟你说。"
乔予安,"说。"
"那个成员提了感知变量主观性的问题,"许宁说,"你第一句话是'这个问题我承认没有完全解决'——你知道大部分人在那个场合不会这样说吗?"
乔予安,"那他们会说什么。"
"他们会绕,"许宁说,"或者解释为什么不算问题,或者说'我们已经考虑过了',然后给一个听起来有理但实际上没回应那个问题的说法。你没有,你直接说了这里有个真实的限制,然后说你怎么处理的,然后说如果他有更好的方法你愿意听。"
乔予安,"因为那个问题他说的是真的,我没有完全解决。"
"我知道,"许宁说,"但'说出来'和'知道'是两件事。你说出来,他反而没有办法再拿那个问题做文章了,因为你已经把那个问题的边界划出来了,讨论就往前走了。"
乔予安走了几步,把这话在脑子里放了一下,她没有刻意做那个动作,但许宁说的是准的——她说"这个没有完全解决",不是在示弱,是在把那个地方的边界画清楚,边界画清楚了,对话才能往有用的地方走。
许宁,"你在那种场合不把自己的方法论当成要守住的地盘。"
乔予安,"因为方法论是用来做事的,不是用来赢的。"
许宁走了一段,然后说,"嗯,"停了一下,"这件事你知道的,但不是每个人都这样运作。"
---
那天晚上,乔予安把那个年份的入学数量统计好,发给了负责人,顺手把数据处理的脚本也整理了一份,附在邮件里说"下次需要类似统计可以直接用这个"。
发完,她关了电脑,往椅背上靠,想了一下今天那件事——那个感知变量的问题,她说"没有完全解决"的时候,其实她自己也有一点点不确定,不确定那样说是不是正确的,但她还是说了,因为它是真的。
许宁说"大部分人不会这样说"。
她想了一下,她当时不是在计算,就是因为那是真的,所以说了出来,没有想过要不要说。但这件事在许宁眼里是不一样的,是可以被看见、可以被说明白的一件事,有它自己的逻辑。
她把手机拿起来,翻了翻,没有新消息,然后想到他今天应该在写论文,就发了一条过去,"你今天写到哪里了。"
---
陈屿澈那边,他那天下午到图书馆坐了将近五个小时。
论文的正文框架已经立好了,但第三节出了一个问题——他想用三套就业口径的数字来说明"定义权"这件事,但在动笔写的时候,他发现那个结论的推导过程有一个地方他绕不过去:他能说三套数字不同,但他没有办法直接从"三套数字不同"推导到"是因为定义权的差异",中间缺一步,缺一个连接那两件事的论证。
他把那一段写了又删,删了又写,写到第四遍的时候,停下来,把那个问题抽出来,单独写在便签上:**数字不同→定义不同→谁有权定义?中间那步怎么论证?**
他盯着那张便签看,那个问题的关键是:你需要证明那些数字的差异确实来自定义的差异,而不是来自其他原因,比如采样方式不同、时间不同、覆盖地区不同。
他把那三套数据重新打开,把采样说明找出来,一份一份仔细看,看到第三份的时候,他发现了一件事:三套数据的采样方式确实有差异,国家统计局用的是入户抽样,研究机构用的是平台问卷,当事人自述是他从几个现有质性研究里整理的,三种采样的覆盖群体其实是有交叉但不完全重叠的。
他把这件事在脑子里停了一会儿,然后意识到:这不是他论证的漏洞,这是他论证的一部分——采样方式不同本身就反映了"谁在操作这个定义"的问题,谁设计了采样框架,谁就在做"什么样的人算在这个统计里"的选择,这个选择本身就是定义权的一种行使。
他把那个想法写下来,很快,就是记住它,然后打开文档,在那段反复删了改了的文字后面,把那个逻辑从头捋了一遍,重新写。
写到一半,手机震了一下,是她发来的,"你今天写到哪里了。"
他把屏幕看了一眼,回,"第三节,卡了一下,想通了,在重写。"
她,"卡在什么地方。"
"采样,"他说,"本来以为是漏洞,后来发现不是,是论证链条里我漏掉的一环。"
她,"怎么发现的。"
"把数据说明找出来重新看了一遍,"他说,"应该早点看的,我跳过了那一步。"
她,"发现得不晚,"停了一下,"我今天项目组那边也处理了一个类似的事,有一个没想清楚的地方被人问出来了,承认了,然后讨论就往前走了。"
他,"怎么处理的。"
"说了没有完全解决,然后说了现有的处理方式,说如果对方有更好的方法愿意听,"她说,"然后他提了一个建议,我接了一部分,改了一个地方。"
他,"那个改法是对的吗。"
"对的,"她说,"他那个问题是真实的,我只是换了一个更诚实的方式表达那个限制,内容没有变。"
他,"嗯,"停了一下,"限制说清楚,结论才站得住。"
她,"你那篇论文里会怎么写限制?"
"还没想到那里,"他说,"写到再说。"
"先写,"她回,"写完发给我。"
他把这句话看了一眼,没有回,把手机放下,继续看他的文档,把那一段重写完。
---
图书馆快关门的时候,他整理好材料,起身,往外走,走过那排书架,走出门,外面是那条梧桐路,冬末,枝条还是光的,但光里有一点点什么,像是在等什么,不着急,就是等着。
他把书包背好,往宿舍走,脑子里还在走那篇论文的逻辑,走到一半,他想到她今天说的那件事——"说了没有完全解决,然后讨论往前走了"——他把这件事在脑子里放了一下,感觉到那件事和他今天自己做的事是同一件事的两个版本:她的是在讨论室里把一个真实的限制说出来,他的是在稿子里把一个自以为是漏洞的地方想清楚。
各自在各自的地方,各自在和各自的那个问题过招,各自在往前走,偶尔停下来说一句,就是这样。
那条梧桐路在那个方向,他往宿舍走,风过来,他把外套的领子翻了翻,继续走。
点击弹出菜单