成员的文章

大学招生和SAT:个人观点

这篇文章改编自一个邀请地址在美国教育研究协会的年会上,举行了2004年4月在圣地亚哥,加利福尼亚州。

本文我的意图是提供一个个人观点的事件导致了重大变化在大学招生测试中,称为坐。新的测试现在在全国人的所有学生必须参加SAT的招生过程的一部分大学2006年秋季入学的班级。希望这个帐户将有用的那些试图改变政策和做法根深蒂固在我们的社会。

在我开始之前,让我来介绍一些术语。“标准化考试”,我的意思是只是一个测试管理的条件下进行,并仔细监控,防止作弊。我也会使用术语“能力倾向测验”和“成就测验。“成就测试旨在衡量掌握特定的主题。相比之下,性向测验是用来预测一个人的能力获利的特定类型的培训或指导。例如,代数测试给定课程结束时将会列为一项成就测试,而测试获得课程前——旨在预测学生在代数课程的表现——会被分类为一个能力测试。在实际实践中,成就和能力倾向测试之间的区别并不是这些定义可能建议整洁,但概念上的差别是有用的。

一个简短的历史
二战后,学院和大学在美国逐渐采用标准化考试作为他们的招生过程的一部分。最广泛的测试选择学习能力倾向测验,称为坐。一些学校使用了美国大学测试程序,或行为,但大多数机构,特别是更有选择性的,选择了坐。

大学理事会(拥有SAT)的非营利组织了一系列测试自成立以来的变化。原来坐了坐我——一个三小时的测试,继续关注语言能力但数量部分覆盖数学主题通常通过八教一年级。此外,美国大学理事会开发23小时SAT II测试旨在衡量一个学生的成绩在特定学科如物理、化学、历史、数学、写作和外语。大多数学院和大学只需要坐我,但有些需要坐I +两个或三个SAT II测试。

今天,在媒体上所提到的,坐时参考总是坐在我的测试已经成为一个关键因素在决定谁是承认,谁被拒绝,更有选择性的机构。

坐的担忧
我坐的担忧可以追溯到1940年代末,当我还是一个本科生在芝加哥大学。许多芝加哥教师都直言不讳的批评者坐下,仅仅认为这是一个多项选择题智商测试的版本;他们认为有力成就测验的大学招生过程。他们的反对可能在一定程度上影响了学校的竞争;坐在后面的主导力量是詹姆斯·b·柯南特总统的哈佛大学。最终芝加哥采用坐,但并非没有争议。

离开芝加哥大学后的几年里,我跟着争论SAT和IQ测试怀着极大的兴趣。我知道卡尔布里格姆,普林斯顿大学的心理学家是谁创造了最初的坐,建模测试,稍早进行了智商测试,并认为这是天生的智力。但是,年后,他坐的有效性表示怀疑和担心,准备测试扭曲的高中学生的教育经验。柯南特也表达了严重的保留意见测试后在他的生活中。

当学生问我关于智商测试,我经常被称为斯蒂芬·杰·古尔德的书对的人在1981年出版的;这是一个令人印象深刻的学术记录了广泛的滥用IQ测试。我知道哈佛大学的迪克·伯恩斯坦和艺术詹森在加州大学伯克利分校的个人和记录他们的有争议的智商。当然,我是一个长期的斯坦福大学教员的地方斯坦福-比奈智力量表被开发。

这些年来,我的观点关于智商测试证明是混合的。作为一个训练有素的医生,手中的测试等韦氏智力量表或者是斯坦福-比奈智力量表在诊断学习问题是有用的工具;他们通常可以确定有人与潜在的,不管是什么原因,未能履行,潜力。然而,这样的测试没有必要的有效性和可靠性排名来证明个人正常的智力,更别说做出罚款的判断很有天赋的人。我的观点类似于阿尔弗雷德·比奈法国心理学家,在20世纪初期,设计了第一个智商测试。比奈非常明显,这些测试可以用于临床,但是拒绝了这个想法,他们提供了一个有意义的精神能力,可以用来衡量个人排名。不幸的是,他的观点很快就忘记了,智商测试行业闯入美国场景。

一个决定性的时刻
我参与了SAT始于1990年代初,当我担任董事会主席测试和评估。马靴是国家研究委员会的董事会负责建议联邦政府的问题上测试和评估。马靴做了一个巨大的服务集成和解释研究成果以建议政府在一个广泛的测试和评估问题几乎所有联邦机构。

担任马靴我的注意力集中在大学招生测试及其对学生的高中教育的影响和随后的生涯。然而,决定性的时刻对我来说发生在华盛顿召开的马靴,特区大学理事会的代表和美国教育考试服务,大学入学考试或ETS,提出他们的意见。我离开了那个会议不到满意。大学委员会和资产的记录在测试开发的技术方面和管理测试,并确保他们的安全。但在这次会议上,坐在我的概念是一个“真正衡量智力”为主。此外,他们似乎无视一些研究表明大学成就测试是一个更好的预测比能力倾向测试成功。

在我回家的路上我停止在佛罗里达访问我的孙子。我发现我的孙女,然后在六年级,已经努力准备通过测试自己坐在长列表的言语类比。她很晦涩难懂的单词记忆的语料库,然后她开始构造类比使用单词。我惊讶的时间和精力,所有在坐的预期。这是我想让我的孙女怎样度过她的学习时间吗?

在飞机上旅行回到加州我起草发表的一篇关于大学入学考试。不是集中在加州大学,但在大学招生。它提出了一系列的观点。一是入学考试不应该来衡量“先天智能”(不管),但实际上应该关注的成就——学生学习在高中期间。此外,这样的测试应该有一篇文章组件要求学生产生实际的写作样本。和测试应该覆盖更多的数学不仅仅是八分之一级介绍代数。

最后,我说,入学考试的一个重要方面是传达给学生,以及他们的老师和父母,学习写作的重要性,掌握至少八的必要性——通过十年级数学。

草案发表的一篇手写的。我和几个亲密的朋友分享它,认为不合适的时间提出这个问题,并把它在我的抽屉里。但后来,当坐的争议爆发以来,记者得知草案,根据《信息自由法》请求它。我懊恼,加州大学总法律顾问宣称这是一个大学的文档和必须交给记者。

泄漏变得泛滥
当我被要求给年度会议上发表主题演讲的美国教育委员会,或ACE, 2001年2月,我的一个同事在总统办公室,帕特Hayashi,建议我们使用专栏草案作为演讲的基础。帕特是加州大学伯克利分校的招生官的年,和当时担任大学委员会的董事会。他一直是一个重要影响我思考招生问题,一般来说,和SAT,特别是。

尽管加州大学总统我已经有足够的争议处理,我喜欢帕特的建议我们继续重做专栏,这一次专注于加州大学(UC的演讲可以找到总统办公室网站www.ucop.edu/news/sat/speech1.html)。简而言之,我说我打算推荐给大学教师,停止使用坐在我和依靠IIs坐到一个适当的成就导向可以开发测试取代坐我这篇演讲的文本是一个严格保密;我只有几个信任的同事共享它。

我飞到华盛顿特区的周五,定于周日下午的演讲。周五晚上我住进酒店。第二天早上我醒来,准备花一个愉快的星期六参观博物馆画廊。当我打开我的酒店的门,在走廊的华盛顿邮报》。头版故事-褶皱的读:“关键测试下火坐在加州。大学校长提出了新的招生标准。“我冲出来检索的副本洛杉矶时报芝加哥论坛报,发现同一件事:头版故事。的纽约时报有一个很长的故事,也开始在首页,一个标题,读“加州的美国试图使用坐在录取结束。“这个故事是特别有趣,因为他们有逐字复制几乎一半的演讲。

我将花一些时间来解释这是怎么发生的。一个年轻人在加州大学新闻办公室要用另一份工作,和他的朋友在美联社。我办公室里的电脑系统没有安全我们曾以为,他能够获得的倒数第二稿演讲。我知道这个,因为在最后一刻拍Hayashi说服我添加一段“全面评估”;即加州大学应该强调录取过程中的多个因素的重要性,而不是过分依赖考试分数。于是我说,“好吧,一段,把它放进草案。”,他做到了。当我看到这段,我很满意,只知道他使用术语“全面审查。“我不喜欢这个词“整体”,它的各种内涵,并迅速把它改为“全面审查。”,但纽约时报》进行“全面的”,因为他们的倒数第二稿演讲。这个词在我直到今天仍屡见不鲜。显然,有些人仍然把原件纽约时报帐户。

公众的反应
我从来没有周六到达博物馆。在一天的大部分时间是花在试图躲避记者和疯狂的加州大学官员的电话。当我到达ACE会议周日下午,礼堂里挤满了人,溢出的房间。与记者还活着的地方。到处都是电视摄像机和卫星提要;这真是一个混乱的场面。斯坦·伊肯伯里,总统的王牌,非常高兴。这是最大的人群,大多数媒体报道的王牌。似乎没有人打扰的演讲被泄露给新闻界的前一天。

观众的反应是美妙的。我预期吸引一些关注在高等教育社区,但我准备公众的反应。显然,这个话题触及美国人内心深处的共鸣。

在接下来的几个月里,我收到了数以百计的人描述他们的来信与坐的经历。我与吉姆·莱勒“新闻一小时”,是在讨论“早安美国。“主要的杂志,等《新闻周刊》美国新闻与世界报道封面故事。我最喜欢的时间杂志;他们投入的问题很大一部分大学入学测试的主题。尼古拉斯·里恩曼,一位记者撰写这本书大考验:秘史的美国精英,写了一个时间我特别喜欢的杂志文章。块包括我的照片在一个页面上,右页面对我是美国总统,乔治•布什(George w . Bush)。在照片的问题是,“这两个男人有什么共同点呢?“莱曼的回答是,我们都支持标准化考试的想法。一些聪明的灵魂推测,我们两个有什么共同点是同样的分数的。幸运的是,我能够回应,“不,那不是。我是一个学生在芝加哥大学,在那个时候,有自己的入学考试,当然,它也不是坐。”

有些人认为我是主张没有测试;他们没去阅读实际的言论。几个星期anti-testing组看到我作为一个英雄,直到他们意识到我不是提议禁止标准化测试。

不幸的是,在一次与记者讨论我描述我的孙女的影响的经验在我的思考,和之后,她经常提到他们的故事。她尴尬的关注和不太满意她的祖父。我以后再回到她在这个问题上的看法。

一个定时炸弹
大学委员会对我演讲的反应却称不上热情。有一些大幅交流媒体和许多坐支持者写了尖刻的文章;一些有点太私人。有些文章写的大学招生官员没有披露他们已经支付大学委员会顾问。和努力争取关键加州大学教师反对这个提议。但是,正如我将解释之后,美国大学理事会,最后,完全同意改革坐。大学理事会的主席,加斯顿卡帕,值得信贷发生了什么。他担任这个角色的西维吉尼亚州州长在改进k - 12教育尤为有效。坐在辩论进化,他表现出非凡的领导力。大学理事会的一些高级人想保持现状,但正如卡帕沉浸自己的问题,他的观点改变了,他得出的结论是,测试需要大修。我很佩服(钦佩)卡帕。 He showed courage and leadership, and change in the SAT I would not have occurred without his involvement.

埋在ACE的演讲是一个非常简短的段落——五句子被大多数人忽略了。指出,加州大学使用它坐在我和三个坐在IIs数年,这几个小规模的加州大学的研究表明,SAT II是大学的更好的预测性能。只是一个简短的段落,几乎没有注意到,但这是一个定时炸弹。

在这一点上它提供了一些历史会有用的。加州大学教师、大学共享传统的治理下,负责招生过程。责任是由董事会行使在招生和与学校的关系,或公猪,加州大学的学术参议院。1960年,当许多大学已经采用了坐,加州大学仍然在录取过程不需要测试。当时,公猪发起了一项研究来比较SAT和几个大学成就测试作为预测性能。结果喜忧参半。成功的成就测验证明一个更有用的预测比SAT,但造福两测试出现边际。公猪决定不介绍入学考试和继续依靠高中成绩。

1968年,加州大学开始要求坐在我和三个SAT II成就测试,虽然申请人的SAT分数也没有包含在常规录取过程。但是,在特殊情况下,SAT分数高的承认有前途的学生高中成绩低于加州大学的标准。加州大学要求申请者参加一组特定的课程在高中;可怜的成绩在这些课程可以抵消SAT分数高。莱曼的,在他的书中,最大的考验,声称加州大学采用的SAT大学理事会是一个转折点。加州大学要求测试后,坐在了入学考试的黄金标准。直到今天,更多的学生申请加州大学坐比在任何其他机构。

到1979年,加州大学面临着越来越严格的入学压力,最后采用SAT作为正式的常规录取过程的一部分。那年,公猪建立了加州大学的资格指数:按比例结合高中平均成绩,或平均绩点,坐我的分数决定一个学生是加州大学的资格。资格指数建立了因为一些研究显示,加州大学接受学生远低于其授权州高中毕业生的前12.5%。注意,只有坐我的分数是包含在资格指数,尽管申请者还需要花三SAT II测试。所有符合条件的学生被保证验收的加州大学校园,但不一定是他们选择的学校。校园招生人员在每个使用的加州大学校园的全部数组数据,包括SAT II,成绩在校园个人决策。

我就任总统后不久,1995年,公猪——我强烈支持——重新定义了合格指数包括GPA +的分数坐在我和三个坐在IIs(写作、数学、和第三个测试学生的选择)。这样做是在几个小规模的基础上研究表明,SAT IIs是好大学成功的预测。公猪建立了加权方案主要重量的平均绩点,但相对体重的人坐在我与重量的三坐IIs。所以,在1995年,这个词去高中学生和他们的顾问,SAT II有了新的意义。

数据的差异
我给我的王牌演讲的时候,我们有四年的数据根据新政策对所有新生都承认,随后进入加州大学校园。我们有大约78000学生协议。协议包括学生的高中成绩,坐在我的分数(口头和定量),三个SAT II成绩,家庭收入、家庭教育背景,高中学生参加的质量,种族,和其他几个变量。当然,该协议包括学生的成绩记录在她或他在加州大学校园的大一。

当我给我的王牌的演讲中,加州大学的分析还没有可用的数据。然而,几个月后,两位研究者在加州大学的总统办公室,扫罗盖斯和罗杰S半岛体育官方网址入口tudley,完成了一个开创性的研究使用的数据集预测效度。这项研究调查了高中成绩和各种组合的有效性的坐在我和SAT II的预测成绩在大学里成功。一个完整的研究已经发表在《华尔街日报》教育评估并可以在加州大学的网站上(www.ucop.edu/sas/research/researchandplanning/pdf/sat_study.pdf)。

总之,研究表明,SAT II是一个更好的大学成绩的预测比坐我的高中成绩和三个坐在IIs占22.2%的方差在大学一年级的成绩。当坐在我添加到高中成绩和SAT IIs,解释方差从22.2%增加到22.3%,微不足道的增量。

数据表明,SAT II的预测效度受到社会经济背景的差异要小得多比SAT。在控制了家庭收入、父母的教育,SAT II的预测能力并未减弱,而坐在我的分数之间的关系和加州大学的成绩几乎消失了。SAT II不仅是一个更好的预测,但也更公平的测试,因为它比坐我明显不敏感差异在家庭收入、父母的教育。

这些发现完整的加州大学数据集持有同样的三个主要学科的数据子集,即:1)物理科学/数学/工程,生物科学2),3)社会科学/人文。在这些学科领域,SAT II是一致预测学生的表现比我坐。

分析关于种族的影响坐在我和SAT II表明,一般来说,只有微小的差异测试。加州大学成绩的SAT II是一个更好的预测比坐我对大多数种族差异,但是这两个测试倾向于“软件开发”新生成绩未被充分代表的少数民族小而可衡量的程度。消除坐在我赞成坐二世会对利率影响甚微的加州大学资格和招生的学生来自不同的种族差异。

加州大学的数据产生另一个有趣的结果。的各种测试,构成了坐在我(口头和量化)和三个坐在IIs,学生成绩的最好预测是SAT II编写测试。鉴于学院写作能力的重要性水平,应该不足为奇,测试实际的写作技巧和大学成绩关系非常密切。

一旦Geiser-Studley研究是公开的,反对改变坐我很快消失。,加州大学教员完全从事规划一个新的招生测试。加斯顿卡帕在2002年3月,担任大学委员会主席宣布他们将消除坐在我然后站和替换它——在全国的基础上——一个新的测试非常符合我最初的提议和加州大学教员的计划已经完成。

适应变化
自那时以来,大学委员会征询了加州大学教员和其他团体在全国新测试。新坐我包括:25分钟论文要求学生产生实际的写作样本,更大量的数学部分评估高级数学技能,阅读理解部分,不包括言语类比。我相信这是一个理想的解决方案,它反映了改变我的王牌演讲中呼吁。加州大学的计划是使用新的坐在我和继续扩大两个SAT II的测试。

当我回首,我惊讶的速度发生了变化。ACE演讲是在2001年2月,美国大学理事会决定改革坐在了我2002年3月,新的测试是现在使用的学生在2006年秋季进入大学。在一个短暂的时间,大学招生将经受了一次革命性的变化,这一变化将会影响到数以百万计的年轻人。

我的孙女在第一批高中学生把新坐在我高中二年级的她把PSAT——一个测试准备老坐着我,做得很不错。她没有犹豫指责我复杂的未来。她的高中很快适应该变化,和现在的学生写了一篇一周一次的25分钟,准备新的测试。

历史的清晰的教训之一是,学院和大学,通过他们的录取要求,强烈影响的学校都教了什么。从我的角度来看,改变了坐在最重要的原因是给一个明确的信息义务教育阶段的学生,他们的老师和家长,学习写作和掌握坚实的数学背景是至关重要的。坐走了一大段路的变化来实现这一目标。



APS定期打开特定的在线文章讨论在我们的网站上。有效的2021年2月,你必须登录APS成员发表评论。通过发布评论,你同意我们社区指导原则和显示您的个人信息,包括你的名字和联系。任何意见、发现、结论或建议在文章评论的作家和不一定反映APS的观点或文章的作者。有关更多信息,请参阅我们的社区指导原则

请登录你的APS账户置评。