My Photo
Name:
Location: Mountain View, California, United States

thinking := [life, games, movies, philosophy, math, coding, pizza, &c.]

Tuesday, March 24, 2009

experimental integrity and the search for causality

The phrase the scientific method implies that there is some universal, automated process that investigators blindly follow in order to do science. In truth, there is a great deal of improvisation and creativity required for the doing of good science. Great leaps forward, such as general relativity or the complex (as in complex numbers) proof of the prime number theorem, often rely on bold, inspired insights into the nature of an unsolved problem.

However, there are a few common principles that unite the rational attitudes of modern research. I want to highlight a few that I feel are somewhat neglected. They are:
  • experimental candor,
  • easily reproducible experiments, and
  • induced correlation.
Experimental candor

Here's a nice way to get great results: suppose you think that drug A will help people lose weight. Conduct a thousand studies on small groups of test subjects. Suppose one of those studies shows good results - publish those good results, and throw away the rest of the results.

This may sound a bit unrealistic, but something like this can happen much more easily in computer science. In this case, there is a growing field of algorithms which are both probabilistic and approximate - very similar to experimental drugs in medicine. If they do pretty well most of the time, that's good enough. Yet with an algorithm, it's incredibly easy to run a million trials of your code, and only publish the best subset of that. Even if the quality of your results are completely random, it's just a matter of time before one small subset of the test results look good.

Hence the need for experimental candor. It's important to reveal all the relevant experiments performed, including the negative or inconclusive ones. The web is the perfect platform for this kind of data disclosure - you can pre-publish your intended experiments and hypotheses before you actually run the experiments. This way, good results look better, and other researchers won't waste time on previously failed experiments. Of course, it's always possible that an experiment failed for unaccounted-for parameters (including human error), which is why experimental reproducibility is also crucial to good research.

Easily reproducible experiments

This scientific tenet is well agreed upon, but poorly executed. In practice, I know of very few experiments which can be very easily reproduced at the research level. In some cases, one may wish to build upon the work of another, such as by augmenting a biochemical procedure with a new step. Articles involving experimental lab work do indeed contain careful procedural explanations meant just for this purpose, which is great. But in many cases, even this is not enough for other researchers - in my days as a grad student, I would see other grad students emailing or calling other investigators (often ones who were considered serious competitors) to ask for critical clarifications in procedure.

We can do better than that.

I'm going to pick on computer scientists for a moment, because they're the worst offenders. An algorithmic experiment has the most potential to be easily reproducible. Ironically, it seems typical to leave out necessary parameters to perform the experiments used in many papers. In order to reproduce a certain graph of time complexity versus input size on a certain real-world dataset, for example, a reader will often have to code up the algorithm based on very vague pseudocode and hand-wavy explanations, guess at parameter values, and separately download the dataset. I've even seen code used which was nowhere available in either pseudocode or executable code - the reference given was by personal communication with another researcher (who won't answer my emails).

There is no excuse for this. Any good algorithmic experiment can be reproducible at the click of a button. The experimenters have already written the code - it is simply a matter of adding a link to this code to a website. It would be friendly to add a little documentation; or better yet, to follow a pattern of operation for the field, in much the same way that some software installation procedures have become standardized.

Induced correlation

This point is a call for the conscious recognition of an idea that's been implicitly used for some time.

Certain experiments have the goal of looking for something like a causal relationship. If a drug company is testing a weight-loss drug, they want to know that their drug causes the weight loss, as opposed to it causing something else, or something else causing the weight loss.

Unfortunately, there's no fool-proof way to experimentally test causality. This is a well-known problem. It's also interesting to note that, philosophically, causality itself is subjective in nature, although that is the matter of another post.

Here's the trouble: Let's hypothesize that chemical X causes weight gain. As an experiment, get a large group of people together. We randomly select some folks as the control - they won't change their diets, and we randomly select some others to change their diet to no longer consume chemical X. We see the desired results: the control group gains a little weight on average, but the experimental group (no chemical X) actually loses some.

Does that mean anyone can prevent weight gain by avoiding chemical X? Absolutely not. Here is one possible explanation: Suppose that the vast majority of foods contain both chemicals X and Y together, or not at all. So when the experimental group avoided X, they were also avoiding Y without knowing it. Now you unleash your study on the world, and everyone starts avoiding X. But there are some foods with chemical Y in it, without X. It could happen that those foods become more popular, or that certain people subconsciously crave Y. In either case, we have people consuming Y, not X, and gaining weight.

Is there anything we can do to experimentally show something stronger than mere correlation? A little bit, yes - we can show induced correlation. This is a correlation between parameters which was observed specifically by either turning on or off the cause in each trial, and purposefully leaving all other known parameters the same. Let's use the term natural correlation to indicate experiments where the cause was either present or absent without any control by the experimenters. Induced correlation gives more evidence of causality than natural correlation since there is more evidence that we can control the effect by controlling the cause.

I think this general idea has been understood already, but I'm not sure that it has been explicitly recognized. My goal throughout this post has been to encourage the codification and emulation of a few good core principles of scientific investigation. There are definitely more key principles, although I've been reminded many times that at least these three could use a little more awareness and observation.

11 Comments:

Blogger Unknown said...

thuoc multivitamin
thuoc giam can tot nhat
mỹ phẩm sakura nhật bản
Bạn đang thắc mắc hay phân vân lựa chọn cho mình loại kem chống nắng cho những ngày hè sắp tới ? Hãy đọc bài viết của chúng tôi để có sự lựa chọn tốt nhất cho mình
kem chống nắng nào tốt nhất hay phân vân vì thuoc uong trang da an toan nhất.
Cách mua hàng trên Amazon

1:06 AM  
Blogger Unknown said...

http://diachichothuexedapotp.blogspot.com/
http://dichvuchothuenguoiyeuotp.blogspot.com/
http://xuhuongphattriencua.blogspot.com/
http://nhungkhokhanvathuanloi.blogspot.com/
http://tuyendungnhanviengiaonhan.blogspot.com/
http://tuyendungnhanvienbanhangtai.blogspot.com/

1:26 AM  
Blogger Unknown said...

http://diachichothuexedapotp.blogspot.com/
http://dichvuchothuenguoiyeuotp.blogspot.com/
http://xuhuongphattriencua.blogspot.com/
http://nhungkhokhanvathuanloi.blogspot.com/
http://tuyendungnhanviengiaonhan.blogspot.com/
http://tuyendungnhanvienbanhangtai.blogspot.com/

1:26 AM  
Blogger Muatotthuoc said...

Xương khớp là một trong những bệnh của tuổi già hay của những người ít vận động. Thai hoa cot song cũng là 1 trong những căn bệnh về xương khớp. Việc chữa trị bằng những phương pháp thông thường có thể kéo dài thời gian lâu hoặc hiệu quả chưa cải thiện tốt nhất.
Vì nhắm bắt nhu cầu đó, chúng tôi cung cấp sản phẩm Davinci Disc Discovery - Thuốc điều trị bệnh thoái hóa cột sống và đĩa đệm. Hỗ trợ 1 cách tốt nhất cho việc điều trị căn bệnh. Ngoài ra mọi người còn có thể sử dụng thêm Dong trung ha thao aloha giúp hấp thụ thêm dưỡng chất tốt nhất.
Công ty MTT chúng tôi còn cung cấp thêm rất nhiều loại sản phẩm cao cấp được sản xuất từ Mỹ. Bảo đảm chất lương hàng 100% là hàng thật và giá cả cạnh tranh nhất trên thị trường. Một số sản phẩm tiêu biểu sau:
fertilaid for women
omega 3 fish oil
collagen youtheory
kem chống nắng neutrogena
melatonin
Ivory caps
kem tri seo
dong trung ha thao
Nếu cho nhu cầu hãy liên lạc với chúng tôi ngay khi có thể. Chúng tôi sẽ tư vấn hỗ trọ các bạn 1 cách nhiệt tình nhất

8:25 PM  
Blogger Hoang Vu said...

việc cần thiết là nên giữ vệ sinh cho bé cũng như sử dụng các dưỡng chất kem chống hăm penaten cho bé. Lựa chọn sữa tắm trẻ em penaten là quyết định đúng của mọi chị em phụ nữ. Ngoài việc giữ vệ sinh khô thoáng cho trẻ, bạn nên sử dụng đến phấn trị rôm sảy cho bé để tránh bị rôm sảy. Việc lựa chọnsữa dưỡng da cho bé sơ sinh là điều mà nhiều bà mẹ đâu đầu. dau massage penaten là sự lựa chọn hàng đầu cho các bà mẹ trên thế giới. Viên uống bổ sung swanson niacin là sự kết hợp độc đáo giữa Vitamin B3 và Niacin. kem trắng răng perl weiss được nghiên cứu bởi các chuyên gia hàng đầu của Đức về lĩnh vực chăm sóc răng miệng. dung dịch dưỡng da giúp giảm các dấu hiệu lão hóa. Dung dịch organic witch hazel của Mỹ chiết xuất 100% thành phần thảo dược tự nhiên được thu hoạch từ rừng ở New England

3:13 AM  
Blogger Unknown said...

Ngày nay việc tìm mua bàn làm việc văn phòng rất đơn giản vì thị trường nội thất văn phòng ngày càng phát triển nhiều xưởng sản xuất cho ra nhiều mẫu mã sản phẩm đa dạng với giá cả khác nhau nên việc chọn mua bàn văn phòng giá rẻ tphcm như thế nào tại đâu hiệu quả tốt nhất giúp đáp ứng nhu cầu sử dụng. Hiện này khi chọn mua nội thất văn phòng thường với xu hướng chọn ghế chân sắt hoặc inox, bàn làm việc chọn loại bàn gỗ. Sự kết hợp của vật liệu kim loại và tự nhiên giúp căn phòng có sự hài hòa và trong đẹp mắt hơn. Hơn nữa việc chọn ghế chân sắt - inox cũng góp phần giảm thiểu được một khoảng chi phí khi loại ghế này có giá rẻ hơn khá nhiều so với ghế làm bằng gỗ, vì với chi phí thuê hay mua một văn phòng làm việc tại TPHCM là không hề rẻ nên cần phải tính toán chi tiêu hợp lý. Ngoài ra, hầu như tất cả văn phòng đều được đặt ở những tòa nhà cao tầng nên việc vận chuyển ghế gỗ khó khắn hơn rất nhiều do có trọng lượng nặng đáng kể. Cho nên khi chọn mua sản phẩm nội thất văn phòng giá rẻ tphcm nhừ bàn ghế hay tủ bạn nên chú ý đến văn phòng của mình vị trí nào đễ dễ cho việc di chuyển sau này. Cho nên khi bạn có nhu cầu chọn mua những mẫu ban lam viec gia re nên cân nhắc đến các vấn đề về: Phong thủy, kích thước diện tích văn phòng, phối màu và sự phối hợp liên quan tới các sản phẩm nội thất khác trong văn phòng đặc biệt là sự di chuyển , bảo hành trong quá trình sử dụng.

6:35 PM  
Blogger Unknown said...

https://maps.google.dz/url?q=http://yduocbinhphuoc.asia//
https://maps.google.ee/url?q=http://yduocbinhphuoc.asia//
https://maps.google.es/url?q=http://yduocbinhphuoc.asia//

6:07 PM  
Blogger Unknown said...

https://maps.google.se/url?q=http://truongcaodangyduocsaigon.info.vn//
https://maps.google.com.et/url?q=http://truongcaodangyduocsaigon.info.vn//
https://maps.google.sk/url?q=http://truongcaodangyduocsaigon.info.vn//

3:15 AM  
Blogger lavithran said...

Good job and great informative blog.
Japanese Classes in Chennai
Japanese Course in Chennai
Best Spoken English Classes in Chennai
French Language Classes in Chennai
pearson vue exam centers in chennai
German Classes in Chennai
Japanese Classes in Tnagar
Japanese Classes in OMR
French Classes in anna nagar
spoken english in anna nagar

10:27 PM  
Blogger Laura Bush said...

It is truly a well-researched content and excellent wording. I got so engaged in this material that I couldn’t wait to read. I am impressed with your work and skill. Thanks.Experimental Trance Courses

5:58 AM  
Blogger Alia parker said...

Couples therapy is a unique and powerful form of therapy that can help couples improve their relationship. Couples therapy is often recommended to couples who are experiencing problems in their relationship. Couples therapy can help couples to resolve issues that are causing tension and conflict in their relationship. Couples therapist

9:41 PM  

Post a Comment

<< Home