<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Statistics | 王祎然</title><link>https://zywhy9.github.io/zh/tags/statistics/</link><atom:link href="https://zywhy9.github.io/zh/tags/statistics/index.xml" rel="self" type="application/rss+xml"/><description>Statistics</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>zh-Hans</language><lastBuildDate>Fri, 15 May 2026 14:06:17 +0000</lastBuildDate><image><url>https://zywhy9.github.io/media/icon_hu_4b660d2ecfa7264e.png</url><title>Statistics</title><link>https://zywhy9.github.io/zh/tags/statistics/</link></image><item><title>南亚综合生物样本库倡议案例</title><link>https://zywhy9.github.io/zh/publications/the-case-of-an-integrated-biobanking-initiative-in-south-asia/</link><pubDate>Fri, 15 May 2026 14:06:17 +0000</pubDate><guid>https://zywhy9.github.io/zh/publications/the-case-of-an-integrated-biobanking-initiative-in-south-asia/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本页摘要为英文原文的 AI 辅助中文翻译，正式引用和技术细节请以英文论文原文为准。&lt;/p&gt;
&lt;/blockquote&gt;</description></item><item><title>将组成不确定性从样本层面快速扩展到总体层面</title><link>https://zywhy9.github.io/zh/publications/taku-preprint/</link><pubDate>Thu, 02 Oct 2025 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/publications/taku-preprint/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本页摘要为英文原文的 AI 辅助中文翻译，正式引用和技术细节请以英文论文原文为准。&lt;/p&gt;
&lt;/blockquote&gt;</description></item><item><title>在耶鲁的第一次 BDSY</title><link>https://zywhy9.github.io/zh/blog/2025-bdsy/</link><pubDate>Sat, 26 Jul 2025 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/2025-bdsy/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
我还在从这六周又累又开心的 BDSY 中恢复。四月加入这个项目时，我一开始完全不知道自己该做什么。后来我花了整整两个月安排六周的课程和活动日程，和耶鲁内外不同的人来回发了几十封，甚至上百封邮件。这是我第一次组织这么大的项目。感谢 Jackson、Yiren、Aquielle、Matt 和 Bhramar，让我有了这段很棒的经历。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;得知这 28 名学生是从 860 多份申请中选出来的时候，我们都很震惊。毫无疑问，他们都是非常有天赋、非常聪明的学生。这六周里，我和他们一起上课、爬山、在湖上划皮划艇、打乒乓球。有时候我会觉得自己好像还是本科生，仍然很有活力。和年轻人在一起总是很开心。&lt;/p&gt;
&lt;figure&gt;
&lt;img src="island.png" title="Thimble Island Tour"&gt;
&lt;figcaption&gt;Thimble Island Tour&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;p&gt;现在，一切结束之后，我已经开始思考明年的 BDSY，甚至未来也许属于我自己的 BDSY。教育一直让我感兴趣，而暑期项目确实是学生学习更多东西的好机会。过程一定会庞杂又混乱，但如果结果是有益的，为什么不呢？&lt;/p&gt;</description></item><item><title>我的论文终于发表了！</title><link>https://zywhy9.github.io/zh/blog/2025-new-paper/</link><pubDate>Fri, 18 Apr 2025 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/2025-new-paper/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
我太激动了，我博士期间的一篇研究论文终于发表了！虽然这大概会是一篇很短的博客，但我还是必须把它记录下来。论文可以在
找到。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;在这项工作中，我们发展了统计方法，用 plant-capture 技术来估计无家可归人口规模，同时考虑捕获状态的不确定性以及不同调查地点之间的异质性。我们将模型应用到美国人口普查局 S-Night 研究的数据上，以提供更可靠的人口规模估计。&lt;/p&gt;
&lt;p&gt;我的 Overleaf 里还有两篇论文在睡觉，希望它们之后也都能发表。与此同时，我还在完成另外两篇论文，计划今年晚些时候投稿。祝我好运！&lt;/p&gt;</description></item><item><title>捕获-再捕获研究的建模与贝叶斯计算</title><link>https://zywhy9.github.io/zh/publications/phd-thesis/</link><pubDate>Mon, 30 Dec 2024 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/publications/phd-thesis/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本页摘要为英文原文的 AI 辅助中文翻译，正式引用和技术细节请以英文论文原文为准。&lt;/p&gt;
&lt;/blockquote&gt;</description></item><item><title>2023 年更多会议！</title><link>https://zywhy9.github.io/zh/blog/2023-conference/</link><pubDate>Wed, 01 Nov 2023 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/2023-conference/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
好，第二篇来写今年的会议。我通常会参加一个统计生态学会议（EURING 或 ISEC）、SSC 年会，也许还会再参加一个统计会议。我之前一直没有机会亲自去加拿大以外的地方参加会议。今年的好处是 JSM 在多伦多举办，所以我终于有机会参加这个五年前就听说过的会议。太好了！我还参与组织了 CSSC，我觉得这是加拿大最大的统计学生会议。这是非常棒的经历，也推荐想提升组织能力的人去申请。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;今年的 SSC 和 CSSC 都在渥太华的 Carleton University 举行。我去年去过 University of Ottawa 参加 CANSSI summer school，但之前从没去过 Carleton。总体来说，这是一次很好的经历，我认识了很多新朋友。这也是 2020 年以来第一次线下 SSC，让我惊讶的是会议提供的餐食，尤其是在博物馆里的晚宴，印象非常深。我也想感谢 CSSC 组织委员会的同事们。我们一起工作了几个月，结果超过了预期。我们不仅收获了很棒的经历，也交到了很多朋友。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-waterloo-warriors-at-ssc"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="Waterloo warriors at SSC"
srcset="https://zywhy9.github.io/zh/blog/2023-conference/ssc_hu_a5cf98bd0a6920ef.webp 320w, https://zywhy9.github.io/zh/blog/2023-conference/ssc_hu_5df521ce279a3553.webp 480w, https://zywhy9.github.io/zh/blog/2023-conference/ssc_hu_7e3d0f4fd0574bbf.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/2023-conference/ssc_hu_a5cf98bd0a6920ef.webp"
width="760"
height="570"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Waterloo warriors at SSC
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;两个月后，JSM 在多伦多举行。作为统计学最大的会议，我从没见过这么大的规模，也没见过这么多著名统计学家。会议里有很多精彩报告和有趣活动。我大部分时间都在 EXPO 里闲逛。一个小技巧是，有些出版社会发样书。我在那里拿到了三本免费书，甚至还得到了 Andrew Gelman 博士本人的签名！虽然听起来有点幼稚，但我必须承认我是 Gelman 博士的粉丝。能见到他、和他说话、还拿到签名，绝对是我人生中难忘的回忆。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-first-time-jsm"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="First time JSM"
srcset="https://zywhy9.github.io/zh/blog/2023-conference/jsm_hu_e190e866271fc4cd.webp 320w, https://zywhy9.github.io/zh/blog/2023-conference/jsm_hu_222a04eac061117a.webp 480w, https://zywhy9.github.io/zh/blog/2023-conference/jsm_hu_d8c54b72f3724dde.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/2023-conference/jsm_hu_e190e866271fc4cd.webp"
width="760"
height="481"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
First time JSM!
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;除了会议，我还参加了 Fields Institute 关于统计生态学的 workshop。我很高兴学到了一些统计课上不会出现的内容，比如和政府、产业界，甚至原住民社区的合作。我必须承认自己对加拿大文化了解不够，尤其是原住民相关的部分。了解他们的知识很有意思，这些知识和我熟悉的体系很不同，但对研究很有帮助。我感觉它有点像中医，也许科学还不能解释其中的机制，但它更多来自一代代人的经验。&lt;/p&gt;
&lt;p&gt;因为我明年夏天就要毕业，明年也许没有机会参加太多会议。希望至少能参加 SSC，因为它会在 Memorial University 举办，而我还没去过魁北克以东的省份。&lt;/p&gt;</description></item><item><title>结束我的 2022 会议季</title><link>https://zywhy9.github.io/zh/blog/conference-report/</link><pubDate>Thu, 14 Jul 2022 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/conference-report/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
终于，我结束了 2022 年为期两周的会议季！我没想到自己的第一次线下会议会来得这么晚。2019 年刚到滑铁卢时，我本来有机会去澳大利亚悉尼参加 ISEC，签证都准备好了，但疫情来了，会议改成线上。这几年滑铁卢也有一些线下会议，但我其实没有真正“参加”。到博士第三年结束时，我终于有机会去蒙特利尔参加 ISBA 2022！当然，主要原因毫无疑问是它在加拿大。感谢 UC Irvine 的老师们，我在蒙特利尔见到了很多美国的教授，也认识了一些研究生和本科生。Andrew Gelman 没来让我有点遗憾，但我幸运地见到了他的一位即将去 USC 的博士后。很多 Bayesian 聚在一起的感觉很好，在加拿大统计系里不太容易感受到，因为加拿大 Bayesian 没有那么多。我还在 ISBA 开幕致辞期间，在酒店房间里给 ISEC 2022 做了线上报告。这大概会成为一个可以拿来当 fun fact 的少见经历。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;
&lt;figure id="figure-some-photos-for-isba"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/isba_hu_d8530279821b373c.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/isba_hu_f8ccf07f0efc1173.webp 480w, https://zywhy9.github.io/zh/blog/conference-report/isba_hu_c901786c691ed2cd.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/isba_hu_d8530279821b373c.webp"
width="760"
height="759"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Some photos for ISBA
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;虽然有很多有趣的报告，但我发现 poster session 才是真正的宝藏。第一场 poster session 里，有一张海报吸引了所有人的目光。是的，它作为海报实在太小了。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-an-a4-poster"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/poster1_hu_234ca0d839e18e9a.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/poster1_hu_263f62eb9952d0a3.webp 480w, https://zywhy9.github.io/zh/blog/conference-report/poster1_hu_d13ccbf81e2b630b.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/poster1_hu_234ca0d839e18e9a.webp"
width="760"
height="428"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
An A4 poster
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;凑近看内容，其实还不错。至少可以去看看他的网站。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-the-contents-of-the-a4-poster"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/poster2_hu_ee22cd16df4d61df.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/poster2_hu_d6ba6c2ec9397988.webp 428w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/poster2_hu_ee22cd16df4d61df.webp"
width="428"
height="760"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
The contents of the A4 poster
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;还有一些有趣的模板，虽然真正的内容有点难找。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-amazon-poster"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/poster3_hu_64b3bb8981661f49.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/poster3_hu_31ebaacca2d5e05.webp 428w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/poster3_hu_64b3bb8981661f49.webp"
width="428"
height="760"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Amazon poster
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;从蒙特利尔回来后，我在家待了两天，给 Mei 准备了一周的食物，然后又出发去渥太华参加 CANSSI summer school。我以前去过蒙特利尔，但这是第一次去渥太华。我和朋友发现机票和火车票价格差不多，而且快很多，于是决定飞过去。但我们的航班先从 Bishop 机场改到 Pearson 机场，之后又经历几次延误通知，最后被取消。幸运的是，我们从 standby list 拿到了晚上 9 点航班的座位，而不是被改签到凌晨 12:30 的航班。&lt;/p&gt;
&lt;p&gt;
&lt;figure id="figure-photos-for-ottawa"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/ottawa_hu_1d08bc1adc417f17.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/ottawa_hu_6a4a79f934bc5519.webp 480w, https://zywhy9.github.io/zh/blog/conference-report/ottawa_hu_49cd4a1f169265ca.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/ottawa_hu_1d08bc1adc417f17.webp"
width="760"
height="569"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Photos for Ottawa
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;
&lt;p&gt;我必须说，和其他报告相比，Changbao 的报告非常精彩。其他报告时我们几乎要睡着了，但他的能量传递给了所有人。遗憾的是，我原本期待在 ISBA 和 summer school 都见到 Xiaoli Meng，但他都没有线下参加。不过我们在渥太华认识了很多新朋友，也看了国会山的灯光秀。&lt;/p&gt;
&lt;p&gt;会议季里还有一个有趣的小故事。我在 ISBA 遇到了多伦多大学的 Vianey Leos Barajas 教授，问她美国有没有做统计生态学的老师。她列了一些名字，包括 Penn State 的 Ephraim Hanks 教授。于是我问了来自 Penn State 的新朋友 Samantha，她说认识他的一位博士生，并告诉了我名字。我查到那位同学的 Twitter 说她会来渥太华参加 CANSSI summer school。太巧了！毕竟美国的人听说这个 summer school 的概率几乎不高。于是我在渥太华见到了 Liz，并和她聊了很多统计生态学。能认识并和新朋友交流真的很好，希望我们很快还能再见！&lt;/p&gt;
&lt;p&gt;最后，我尝试给 ISBA 和 ISEC 的摘要做词云，看看能不能发现一些热门主题。但结果很难做成我想要的样子。我去掉了一些没有信息量的词，下面是得到的结果。如果能包含特定短语可能会更好，但这太耗时间了，而且老实说我对 NLP 也不熟。如果你知道什么容易理解又容易应用的资源，欢迎告诉我！
&lt;figure id="figure-word-cloud-for-isba-2022"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/isba2022_hu_9e51a9c6863be860.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/isba2022_hu_d93c2210fa47458a.webp 480w, https://zywhy9.github.io/zh/blog/conference-report/isba2022_hu_bc5bf43b074f4ede.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/isba2022_hu_9e51a9c6863be860.webp"
width="760"
height="486"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Word Cloud for ISBA 2022
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;figure id="figure-word-cloud-for-isec-2022"&gt;
&lt;div class="flex justify-center "&gt;
&lt;div class="w-full" &gt;
&lt;img alt="screen reader text"
srcset="https://zywhy9.github.io/zh/blog/conference-report/isec2022_hu_812d43fbba70d964.webp 320w, https://zywhy9.github.io/zh/blog/conference-report/isec2022_hu_2b78a917ed1f50ca.webp 480w, https://zywhy9.github.io/zh/blog/conference-report/isec2022_hu_bd82046f4b51a9dd.webp 760w"
sizes="(max-width: 480px) 100vw, (max-width: 768px) 90vw, (max-width: 1024px) 80vw, 760px"
src="https://zywhy9.github.io/zh/blog/conference-report/isec2022_hu_812d43fbba70d964.webp"
width="760"
height="480"
loading="lazy" data-zoomable /&gt;&lt;/div&gt;
&lt;/div&gt;&lt;figcaption&gt;
Word Cloud for ISEC 2022
&lt;/figcaption&gt;&lt;/figure&gt;
&lt;/p&gt;</description></item><item><title>会议日程</title><link>https://zywhy9.github.io/zh/blog/conference-schedule/</link><pubDate>Sat, 26 Feb 2022 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/conference-schedule/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
最近发生了很多大事，比如卡车司机抗议，接着是俄罗斯和乌克兰之间的战争。我也终于自己从多伦多开车去了滑铁卢，路上紧张得不行。我不想在这里分享政治观点，但我觉得还是应该让这个网站保持更新。所以我决定分享一下这个会议季的安排；如果你也会参加其中某个会议，我很乐意和你聊聊。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;首先，我会在四月做博士 proposal。四月底，我们系会举办一个会议：
。虽然它可能和我的研究关系不大，但我也许会听一些关于数据整合的报告，因为我听说这是 survey sampling 里最近很热门的话题。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;5 月 30 日到 6 月 3 日&lt;/em&gt;，加拿大大多数统计人都会参加
。这个会议原本计划在 Vancouver 举行，后来改成线上。我会做一个关于自己研究的口头报告。接着 &lt;em&gt;6 月 10 日到 6 月 15 日&lt;/em&gt;，我会听
的一些报告。&lt;/p&gt;
&lt;p&gt;&lt;em&gt;6 月 25 日到 7 月 1 日&lt;/em&gt;，我会去蒙特利尔（！！！）参加
并做报告（如果申请被接受的话）。终于有线下会议让我非常兴奋，也能在那里见到一些 UC Irvine 的老师，也许还有同学！在蒙特利尔期间，我还得同时给另一个线上会议
做报告。统计生态学主要有两个会议：ISEC 和 EURING。所以这是认识更多这个领域研究者的好机会。ISEC 2022 会在 &lt;em&gt;6 月 27 日到 7 月 1 日&lt;/em&gt; 举行，是 hybrid 形式，可以线上参加，也可以线下去南非开普敦参加（我没有勇气去）。&lt;/p&gt;
&lt;p&gt;这些会议结束之后，我会有几周时间准备博士最后一年的学习。如果你也会去这些会议，欢迎告诉我。我也在考虑给 ISBA 找室友来降低费用！&lt;/p&gt;</description></item><item><title>新的 Rhat</title><link>https://zywhy9.github.io/zh/blog/rhat/</link><pubDate>Sat, 17 Apr 2021 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/rhat/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
我觉得需要再强调一下，这篇文章只是我的随机想法，我知道得太少，不足以评论任何事情。所以请不要太认真看待我的话。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;最近，我注意到 Bayesian Analysis 上的一篇论文：
，作者是 Vehtari, A., Gelman, A., Simpson, D., Carpenter, B., 和 Bürkner, P. C.。标题里的 $\hat{R}$ 吸引了我，因为我刚完成关于 Rhat 的口试。另外，Gelman 的想法也很吸引我，所以我读了一些论文，也在 YouTube 上看了他的报告。我不会讨论这篇论文的理论部分，因为我并不真的想把所有数学都弄清楚。如果你对 MCMC 感兴趣，可能会想读这篇论文，因为 Rhat 是 MCMC 中用于评估收敛的重要且常用的指标。&lt;/p&gt;
&lt;p&gt;
在 1992 年提出了 Rhat。我第一次读这篇论文时，发现他们把 Rhat 定义为一种实用指标，面向“主要关心数据和模型背后科学问题的研究者，而不是关心迭代模拟本身概率理论的研究者”。另外，常用的 1.1 截断值似乎也没有明确来源，这比 p 值里的 0.05 还糟糕。常见形式的 Rhat 实际上来自
。读完后，我觉得 Rhat 的定义有些模糊，也许会被不断修改和改进。新的 Rhat 论文就这样出现了。虽然我知道 Rhat 是两个方差之间的比值，但我仍然不知道 $\hat{R}$ 小于某个阈值是否就能断言收敛。归根结底，收敛本身也许就是一个很难定义的东西。&lt;/p&gt;
&lt;p&gt;我和 Martin 聊过这篇论文和 Gelman。他也认为 Rhat 有一些缺点，也不知道阈值从何而来。但我们都同意 Gelman 是天才，也是很有创造力的思想者。从他的评论里我意识到，未来 Monte Carlo SE 和 effective sample size (ESS) 可能会被更多讨论，而这对我来说也是一个有趣的方向。很高兴看到新的论文里也提到了 ESS，虽然 ESS 本身也有缺陷。嗯，这也许是一个值得探索的方向。&lt;/p&gt;</description></item><item><title>贝叶斯主义与频率主义</title><link>https://zywhy9.github.io/zh/blog/bayesian-and-frequentist/</link><pubDate>Sun, 28 Feb 2021 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/bayesian-and-frequentist/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
最近我在准备要在 EURING 和 SSC 上展示的项目，同时也花时间看了一些 Andrew Gelman 在 YouTube 上的报告。他提到的一个话题和我之前博客里提出的问题有关。他说在一次会议上，有人认为频率学派应该更 Bayesian，而 Bayesian 也应该更 frequentist。我当时也在想，或许会有一种结合两种思想的一般方法。几个月前，我读到一篇博客，可能是谢益辉写的，谈到某本教材里试图提出一种用贝叶斯方法得到频率学派度量的方法。我记不清细节了（我的记忆真的很差），但记得 Gelman 写过文章批评它。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;对 Gelman 来说，他认为 Bayesian 应该更 Bayesian，也就是在模型中纳入更多真实信息；frequentist 应该更 frequentist，也就是按照实际执行方式评价程序，包括分叉路径等。首先，我必须说明，我只是一个什么都不懂的学生，对相关哲学和理论了解很少。我博客里写的都只是随机想法。我常觉得自己是那种以为自己什么都懂、其实什么都不懂的典型例子。在我的理解里，flat prior 也是一种“有信息”的 prior，因为它表达了我们目前认为分布是平的。即使你认为性别比例是 1:1，这也是一种先验信息，因为你相信它们相同。对贝叶斯方法来说，所有信息都只来自数据并不一定是好事。这意味着我们放弃了贝叶斯方法的大部分优势，得到的结果可能和频率学派方法一样，甚至更差。&lt;/p&gt;
&lt;p&gt;我意识到自己之前想的其实就是：有先验信息时用 Bayesian，没有时用 frequentist。这也正是统计学家现在常做的事：选择更适合具体问题的方法。这是实践中解决问题的最好方式。我也看到很多评论说不应该继续 Bayesianism 和 Frequentism 之间的争论，但我仍觉得这类讨论有意义。只有通过讨论，才可能让更多人了解并使用贝叶斯方法，也会刺激更多新方法的发展。&lt;/p&gt;
&lt;p&gt;最近我在读一些论文和博客，列在下面。还没全部读完，但正在读。我感觉自己知道得太少，需要学习和阅读的东西太多，所以希望三年后能顺利毕业。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Efron, B. (1986). Why isn&amp;rsquo;t everyone a Bayesian?. The American Statistician, 40(1), 1-5.&lt;/li&gt;
&lt;li&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;/li&gt;
&lt;/ol&gt;</description></item><item><title>《女士品茶》笔记 2</title><link>https://zywhy9.github.io/zh/blog/lady-tea-note-2/</link><pubDate>Thu, 11 Feb 2021 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/lady-tea-note-2/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
虽然这本书标题里有 “lady”，但读的时候会发现书中提到的女性并不多。Florence Nightingale 只有几句话，Florence Nightingale David 有整整一章，其他女性统计学家则散见于一些小节。正如书中所说，统计学发展的早期由男性主导。但今天情况已经变化很多。我遇到过许多优秀的女性统计学家，也从她们身上学到很多。本科和硕士期间，我的女同学大约是男同学的两倍，这让我很少意识到早期统计学中性别的影响。所以这篇博客想写一些在某种程度上影响了我统计观念和研究生活的女性统计学家。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;h2 id="florence-nightingale-david"&gt;Florence Nightingale David&lt;/h2&gt;
&lt;p&gt;首先简单回顾 Florence Nightingale David 那一章。得知她的父母是 Florence Nightingale 的朋友，而她的名字也由此而来时，我很惊讶。因为她长期和 Karl Pearson 共事，所以她从一个很低的位置“看到了所有主角”。然而直到 Karl Pearson 去世前几个月，Neyman 才发现她其实没有博士学位。她的工作显然被低估了，尤其是在她和 Karl Pearson、Jerzy Neyman、Ronald Fisher、Egon Pearson 共处一个系的时候（William Gosset 有时也会路过）。后来我发现她创立了加州大学河滨分校的统计系，这让我想起了 UCI 的系。&lt;/p&gt;
&lt;h2 id="jessica-utts-教授"&gt;Jessica Utts 教授&lt;/h2&gt;
&lt;p&gt;F. N. David 让我想起了我在 UC Irvine 时的 Jessica Utts 教授。我第一次见到她是在 2016 年上海的 ICSA 会议上，当时 Utts 教授是 ASA 第 111 任主席。那时我是大四学生，刚完成美国研究生申请。如果没记错，我去那里是因为女朋友想和一些教授交流，看看有没有加入项目的机会。我们并非正式参会，而是假装成忘带名牌的博士生。那是我第一次“参加”国际学术会议，看到只在教材里见过名字的著名统计学家就在眼前，完全被震撼了。我听了 Utts 教授关于数据科学和统计教育的报告，也是第一次听到并思考这些话题。后来我还参加了一个由多个著名统计组织代表参与的 session，之后和 Utts 教授聊天，告诉她我申请了 UCI，希望很快能见到她。这个愿望后来实现了。她在系里的聚会上讲过一些有趣的事情，比如我们系最初几年的样子，以及她如何和 Wesley Johnson 教授一起加入这个系。她还说，如果你搜索 “women statistician”，会看到她的名字（当时大概排第三或第四）。她一个有趣的经历是曾研究过 remote viewing，并受到广泛媒体报道，相关文章可以在她的网站上找到。&lt;/p&gt;
&lt;p&gt;对我来说，Utts 教授像是为我打开统计学大门的人。那时我并不知道中国之外的统计学是什么样子，而她是我第一个真正交流过的“有影响力”的统计学家。我还记得她报告里的一句话：“中国的统计学比美国落后 50 年。”我必须承认这有它真实的一面，而中国的统计教育需要由我们这一代推动巨大的改变。这也成为我想做教授的原因之一。&lt;/p&gt;
&lt;h2 id="zhaoxia-yu-教授"&gt;Zhaoxia Yu 教授&lt;/h2&gt;
&lt;p&gt;Yu 教授在 UCI 教过我概率、统计、多元统计方法等课程。我也非常感谢她给了我第一次研究机会。UCI 第一年，她让我做 principal geodesic analysis 的文献综述，那是我第一次读英文论文并做报告。虽然我现在不做图像分析，但那段经历让我学到很多。UCI 最后一个学期，她还给我机会协助一位访问学者做研究，我们用 factor analysis 分析与自闭症相关的数据。她用中文和我说话时，会让我有一种妈妈在和我说话的感觉。可能因为她们都是大学教授，年龄也相近。我申请博士项目时 CV 上的大部分研究经历都和 Yu 教授有关，所以非常感谢她的教学和帮助。&lt;/p&gt;
&lt;h2 id="audrey-béliveau-教授"&gt;Audrey Béliveau 教授&lt;/h2&gt;
&lt;p&gt;最后，我想感谢我的导师 Audrey，是她给了我来这所很棒的学校读博士的机会。她给我发面试邮件时已经过了 4 月 15 日，而我已经接受了一所美国学校的 offer（没有滑铁卢有名，但 funding 很有吸引力）。那时我正和 Mei 在广州旅行。得知拿到滑铁卢大学 offer 时我非常开心，第一件事就是查 UWaterloo 是否受 April 15 Resolution 约束。发现可以接受后，我一分钟内就做了决定，拒掉了之前的 offer。嗯，这不算一个特别好的操作，但 Mei 在多伦多，所以滑铁卢显然是更好的选择。&lt;/p&gt;
&lt;p&gt;一开始我担心 Audrey 是助理教授，可能意味着作为她的博士生会有更多任务。但她非常善良、乐于帮助，甚至支持我去参加一个我没有报告的会议。我们组每年还会有社交活动，通常是桌游夜。能有她做导师我觉得很幸运，也期待在博士剩下的时间继续和她一起工作。&lt;/p&gt;</description></item><item><title>《女士品茶》笔记 1</title><link>https://zywhy9.github.io/zh/blog/lady-tea-note-1/</link><pubDate>Tue, 12 Jan 2021 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/lady-tea-note-1/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
首先我想说，我不是一个特别会写“笔记”的人，所以并不想真正写那种包含很多个人解读和洞见的读书笔记。不过，对于所有对统计学感兴趣的人，我都推荐这本书。David Salsburg 用许多著名统计学家的故事介绍了统计学中的常用方法和定义，也让人看到统计学历史上一些现在很少被讨论的大争论。无论书中的故事是否全部准确，它都让我更清楚地看到了现代统计学的发展过程。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这本书最早是东华大学刘欣老师在统计学导论课上介绍给我的。当时我并不知道书的内容，但听说过中文版译者邱东老师，他曾是我父母所在大学的校长。所以我找到了这本书，不过直到去美国读硕士后才真正开始读。&lt;/p&gt;
&lt;p&gt;虽然几年前就开始读这本书，但因为课程很忙，也没有详细的阅读计划，我总是在前几章后停下来。最近我看到很多博士生或教授会在博客里列书单，又觉得 STAT 900 之后自己需要更多额外知识来补理论基础，于是重新拿起这本书。到现在已经读了一半多。它不是教材，也不是理论书，但我从中学到了很多关于方法最初如何被提出、第一代现代统计学家如何看待世界的想法。&lt;/p&gt;
&lt;p&gt;毫无疑问，Fisher 在现代统计学和这本书中都扮演了重要角色。书中几乎一半内容都与 Fisher 有关。你会知道，他糟糕的视力不仅给了他厚厚的眼镜，也给了他不同寻常的几何直觉。他是一个为统计学做出巨大贡献的天才，同时也树了很多“敌人”。历史上这样的人总是评价复杂。对 Fisher 来说，看他的贡献就好，不要太看他的性格，否则你一定会感受到他的尖刻和优越感。&lt;/p&gt;
&lt;p&gt;最后用书里的一个故事收尾。Jerzy Neyman 一直被 Fisher 攻击，直到 Fisher 1962 年去世，但他从未回应。有一次 Neyman 在国际会议上用法语报告，Fisher 坐在台下。Neyman 以为 Fisher 会抓住论文里某个不重要的小问题攻击他，把论文和他本人都“撕碎”。然而报告结束后，Fisher 什么也没说。后来 Neyman 才发现，Fisher 不会说法语。想到 Fisher 和 Neyman-Pearson 之间那场大“战争”，如果我是 Neyman，我不知道自己是否有信心在这样的压力下和 Fisher 争论。&lt;/p&gt;</description></item><item><title>写给统计学的问题</title><link>https://zywhy9.github.io/zh/blog/questions-to-statistics/</link><pubDate>Mon, 04 Jan 2021 00:00:00 +0000</pubDate><guid>https://zywhy9.github.io/zh/blog/questions-to-statistics/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;说明：本文为英文原文的 AI 辅助中文翻译，可能没有完全保留原文语气；如需核对细节，请切换到 English 版本。
作为统计学学生，这七年来我越来越觉得这门学科有趣。但与此同时，我也有越来越多问题，关于统计学的基础、统计学的未来等等。我想推荐《The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century》这本书，用来了解统计学历史。那是一段非常有趣的历史，基本围绕几位著名统计学家展开。如果你在
上查自己的学术谱系，会发现一些非常有名的人。对我来说，往前三代是 Blackwell，六代是 Fisher，十代是 Poisson。这个领域很小，所以很容易找到彼此之间的联系。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;我向一些教授问过这些问题，也尝试用自己有限的经验回答。有些问题容易回答，而且得到的答案相似；有些问题基于当前状态很难回答。我也想把这些问题问给读者，你也可以思考类似的问题。&lt;/p&gt;
&lt;h3 id="1-你是-bayesian-还是-frequentist-是一个合理的问题吗成为-bayesian-statistician-意味着什么它们未来会统一吗"&gt;1. “你是 Bayesian 还是 frequentist” 是一个合理的问题吗？成为 Bayesian statistician 意味着什么？它们未来会统一吗？&lt;/h3&gt;
&lt;p&gt;现在人们会同时使用两个学派的方法来解决问题。似乎只要能完成工作，大家对频率学派和贝叶斯学派之间的哲学争论就没那么感兴趣了。所以有人称自己为 pragmatic Bayesian，而不仅仅是 Bayesian。就像历史上许多定义之间的冲突一样，如今我们只是学习并使用两者，却未必知道它们之间曾有过很大的争论。这重要吗？我不知道，但我觉得至少了解它们意味着什么、代表什么是好的。从 UC Irvine 毕业时，我觉得自己是 Bayesian，因为我选择把贝叶斯方法作为研究兴趣之一。所以当 Jock 问“我们班里有 Bayesian 吗？”时，我毫不犹豫地回答了。但上了几门课之后，我发现自己还太不成熟，不足以称自己为 Bayesian。还有太多思想我没听说过，也没有完全理解。因此现在回答这种问题时我会很谨慎。至于最后一个问题，我想象的是类似 Theory of Everything 的东西，而不是简单把 frequentist 和 Bayesian 方法拼在一起。我们知道，当使用无信息先验且样本量足够大时，后验分布会给出类似 MLE 的估计。因此，也许存在一种可能，把这些相似的方法统一为一种更一般的方法。&lt;/p&gt;
&lt;h3 id="2-你如何定义统计学也许还有数据科学你认为未来的统计学会是什么样"&gt;2. 你如何定义统计学，也许还有数据科学？你认为未来的统计学会是什么样？&lt;/h3&gt;
&lt;p&gt;随着统计学和其他学科之间的边界越来越模糊，比如数据科学和某种程度上的计算机科学，精确定义这些学科越来越困难。关于什么是数据科学，有很多论文、文章和报告。不同人有不同定义。有些人说数据科学是交叉学科，也有人说统计学包含在数据科学里，因为统计学处理数据。在中国，一些统计系被替换或并入数据科学学院、大数据学院。我认为原因很明显：数据科学和大数据是热门趋势，这个名字能带来更多经费和项目。像 Paul 一样，如果未来统计学消失或变成别的东西，我不会惊讶。在我看来，统计学本身的理论基础其实很弱，因为它是一门经验学科。这七年来我学到的一点是：没有什么是不可能的。有时我会想，这是否意味着我们其实什么也没学到，这有点悲伤。&lt;/p&gt;
&lt;h3 id="3-虽然我们接受训练拥有专业知识和技能但资本认为我们有多少价值我们在行业中的优势是什么"&gt;3. 虽然我们接受训练，拥有专业知识和技能，但资本认为我们有多少价值？我们在行业中的优势是什么？&lt;/h3&gt;
&lt;p&gt;很多公司都有“data scientist”职位，但很多公司并不知道这些 data scientist 应该做什么。疫情初期，我听说一些公司解散了数据科学部门。也许这是它们认真思考这个问题的好时机。另一方面，懂得使用 R/Python 包、具备一定统计知识的 CS 学生也可以成为 data scientist，而且他们的编程能力可能比统计学生更强。Jock 说过：“统计学一定是最广泛教授、也最糟糕教授的学科之一。你告诉别人你是统计学家，几乎一定会听到对方说统计学是他们上过最糟糕、最没用的课。”因此，统计学给人的印象常常是无用。此外，在这个时代，人们关注速度，质量排在第二。如果一个包能处理所有事情，为什么还需要统计学家？&lt;/p&gt;
&lt;h3 id="4-什么时候你觉得自己有足够知识独立做项目什么时候你发现自己有足够知识去思考统计学的基础问题"&gt;4. 什么时候你觉得自己有足够知识独立做项目？什么时候你发现自己有足够知识去思考统计学的基础问题？&lt;/h3&gt;
&lt;p&gt;这两个问题不像前面那些那么重要或深刻。我只是不知道现在是不是思考这些问题的好时机，也不知道博士之后会怎样。博士毕业生应该达到什么水平？我离那个水平还有多远？&lt;/p&gt;
&lt;p&gt;我一直同意，思考某个事物的一般性和基础性问题是有益的。思考万事万物最深层的基础，有助于理解这个世界并形成自己的世界观。希望几年之后，我能回答其中一些问题，并提出新的问题。&lt;/p&gt;</description></item></channel></rss>