P e d a g o g i e n s
최근 공개된 용어 (총 97개)
재검사신뢰도
조회수: 31. 개념 - 동일한 검사를 동일한 대상에게 일정한 시간 간격을 두고 두 번 실시했을 때, 두 점수 사이의 일관성을 의미함. - 쉽게 말해, "어제 본 시험 점수가 오늘 본 점수와 비슷한가?"를 따져보는 것임. 2. 산출 방법 동일한 검사 도구를 사용함. 피험자 집단에게 첫 번째 검사(검사)와 두 번째 검사(재검사)를 시행함. 두 점수 간의 상관계수를 계산하여 신뢰도 계수를 얻음. 3. 주요 특징 및 장점 안정성 계수: 시간의 흐름에 따른 점수의 일관성을 측정하기 때문에 '안정성 계수'라고도 부름 적용의 간편함: 새로운 검사지를 만들 필요 없이 기존 검사지를 그대로 다시 사용하면 되므로 경제적임. 4. 결정적인 단점 (오차의 원인) 재검사 신뢰도는 이론적으로는 명쾌하지만, 실제 적용 시 다음과 같은 이월 효과(Carry-over effects) 문제가 발생함. - 기억 효과(Memory Effect): 첫 번째 시험에서 풀었던 문제나 답을 기억하고 있어 두 번째 시험 점수가 인위적으로 높아질 수 있음. - 연습 효과(Practice Effect): 첫 번째 시험을 치르는 과정에서 검사 요령을 터득하여 두 번째 시험 성적이 올라갈 수 있음. - 태도 및 동기 변화: 두 번째 시험을 볼 때 지루함을 느끼거나 성의 없이 응할 경우 신뢰도가 낮게 나타남. - 시간 간격의 딜레마: * 간격이 너무 짧으면? → 기억/연습 효과가 커짐. 간격이 너무 길면? → 그 사이 학생이 실제로 '성장'하거나 '망각'하여 점수가 변함(측정 오차가 아님에도 신뢰도가 낮게 측정됨). 5. 실무적 팁 일반적으로 재검사신뢰도를 높이기 위해서는 검사 간격을 2주에서 4주 정도로 잡는 것이 권장되지만, 측정하고자 하는 대상(지능, 성격, 학업성취도 등)에 따라 적절한 간격 설정이 매우 중요함.
능력지향평가
조회수: 31. 개념 - 능력지향평가(Ability-Referenced Evaluation)는 학생이 지닌 잠재적 능력과 비교하여 얼마나 최선을 다했느냐를 판단하는 평가 방식 일반적으로 성적이 높은 학생이 좋은 점수를 받는 기존 방식과 달리, '자신이 가진 능력만큼 성취를 이루었는가'에 초점을 맞춤. 2. 주요 특징 - 개별화된 기준: 평과의 기준이 외부(타인이나 절대 점수)에 있지 않고, 학습자 개개인의 능력에 있음 - 노력과 과정 중시: 단순히 결과물(점수)만 보는 것이 아니라, 그 결과가 학습자의 잠재력에 비추어 볼 때 어느 정도 수준인지를 해석함 - 상대적 비교 지양: 옆 친구와 점수를 비교하는 것이 무의미해지며, 본인의 역량 발휘 정도가 핵심이 됨 3. 장점 - 학습 동기 유발: 성적이 낮더라도 자신의 능력 범위 안에서 최선을 다했다면 좋은 평가를 받을 수 있어, 학습 의욕을 고취함 - 개별화 교육 실현: 학생마다 서로 다른 출발점과 역량을 인정하므로 맞춤형 지도가 가능해짐 - 심리적 부담 완화: 타인과의 경쟁에서 오는 스트레스를 줄이고 자아존중감을 높이는 데 도움이 됨 4. 단점 및 한계 - 능력 측정의 어려움: 학습자의 '잠재적 능력'을 객관적이고 정확하게 측정할 방법이 마땅치 않음. (지능 검사 등을 활용하지만, 지능이 곧 모든 능력은 아니기 때문임.) - 교사의 주관 개입: 능력을 판단하는 과정에서 평가자의 주관이 들어갈 위험이 큼. - 상급 학교 진학 활용의 한계: 선발이 목적인 시험(예: 수능, 공무원 시험)에서는 공정성과 객관성 문제로 적용하기 어려움.
컴퓨터보조검사
조회수: 31. 개념 종이와 펜 대신 컴퓨터를 활용하여 시험을 치르고 평가하는 방식. 단순히 매체만 바뀐 것이 아니라, 평가의 효율성과 정확도를 획기적으로 높인 기술적 진보임 2. 종류 - 일반 CBT (Computer-Based Test): 모든 수험생이 동일한 문항을 컴퓨터 화면으로 풀이하는 방식입니다. 종이 시험(PBT)을 그대로 디지털로 옮긴 형태 - 컴퓨터 적응검사 (Computerized Adaptive Testing, CAT): 수험생의 실력에 맞춰 문제의 난이도가 실시간으로 조절되는 지능형 검사 첫 문제를 맞히면 더 어려운 문제가 나오고, 틀리면 더 쉬운 문제가 제시됨 적은 문항 수로도 수험생의 능력을 매우 정교하게 측정할 수 있음. 개념 종이와 펜 대신 컴퓨터를 활용하여 시험을 치르고 평가하는 방식. 단순히 매체만 바뀐 것이 아니라, 평가의 효율성과 정확도를 획기적으로 높인 기술적 진보임 2. 종류 - 일반 CBT (Computer-Based Test): 모든 수험생이 동일한 문항을 컴퓨터 화면으로 풀이하는 방식입니다. 종이 시험(PBT)을 그대로 디지털로 옮긴 형태 - 컴퓨터 적응검사 (Computerized Adaptive Testing, CAT): 수험생의 실력에 맞춰 문제의 난이도가 실시간으로 조절되는 지능형 검사 첫 문제를 맞히면 더 어려운 문제가 나오고, 틀리면 더 쉬운 문제가 제시됨 적은 문항 수로도 수험생의 능력을 매우 정교하게 측정할 수 있음 2. CBT의 장점 - 즉각적인 피드백: 채점 과정이 자동화되어 시험 종료 직후 성적 확인이 가능함 - 멀티미디어 활용: 텍스트뿐만 아니라 오디오, 비디오, 시뮬레이션 등을 활용한 입체적인 평가가 가능함. (예: 영어 듣기 평가, 과학 실험 시뮬레이션 평가) - 개별화된 검사 환경: 수험생마다 각기 다른 시간에 시험을 보거나, 본인의 속도에 맞춰 진행할 수 있음. - 데이터 관리의 용이성: 문항 반응 이론(IRT) 등을 적용해 정답률, 변별도 등을 통계적으로 관리하기 매우 유리함. 3. 고려해야 할 단점 및 한계 - 컴퓨터 리터러시: 기기 조작 숙련도에 따라 시험 결과에 차이가 생길 수 있는 '디지털 격차' 문제가 발생할 수 있음. - 초기 구축 비용: 시스템 서버 구축, 보안 유지, 단말기 보급 등에 많은 예산이 소요됨. - 가독성 및 피로도: 장시간 화면을 응시할 때 발생하는 눈의 피로감이 종이 시험보다 클 수 있음. 4. 교육적 의의 CBT는 단순한 지식 암기 확인을 넘어, 학습자의 사고 과정을 추적하는 데 최적화되어 있음. 예를 들어, 특정 문제를 푸는 데 걸린 시간이나 답을 수정하는 패턴 등을 분석하여 학습자의 취약점을 진단하는 '형성평가' 도구로 널리 활용되고 있음. 최근에는 인공지능(AI)과 결합하여 더욱 정교한 맞춤형 학습 경로를 제시하는 방향으로 발전하고 있음.
준거지향평가
조회수: 41. 개념: 교육 목표 도달 여부를 확인하기 위해, 미리 설정한 구체적인 기준(준거)에 따라 학습자의 성취 수준을 평가하는 방식입니다. 절대평가 또는 목표 지향 평가라고도 하며, 타인과의 비교가 아닌 학습목표 달성도를 측정하여 교수학습 개선과 완전학습을 도모하는 것이 목표입니다. 2. 핵심 특징 및 내용 • 목적: 학습 목표 달성 정도 파악, 교수-학습 방법 개선, 개인별 성취 수준 확인. • 평가 전 성취해야 할 목표(예: 100점 만점 중 80점 이상)를 명확히 설정. • 평가 방식: 타인과의 상대적 순위가 아닌, 설정한 기준에 도달했는지 여부(Pass/Fail)로 판단. 3. 장점: 경쟁 완화 및 협력 학습 유도, 교육 과정 개선에 용이, 학생의 구체적 학습 상태 파악 가능. 4. 단점: 명확한 준거 설정이 어렵고, 개인차 변별이 어려워 선발용으로는 부적합할 수 있음. 즉, 준거 지향 평가는 '누가 더 잘했나'가 아니라 '누가 무엇을 알고 모르는가'를 중심으로 학습을 돕는 데 초점을 둡니다.
규준지향평가2
조회수: 51. 개념: 개인의 성취 수준을 집단 내 다른 구성원들의 점수(규준, Norm)와 비교하여 상대적인 서열(석차, 백분위 등)을 판단하는 평가 방식입니다. 선발적 교육관에 기초하여 개인차 변별과 우수자 선발, 경쟁을 통한 학습 동기 유발에 효과적입니다. 2. 핵심 특징 및 목적 • 상대적 위치 파악: 집단 안에서 나의 위치가 어디인지 확인. • 선발적 교육관: 개인차를 변별하여 우수자를 선발하는 데 중점. • 신뢰도 중시: 측정의 객관성을 중요하게 생각함. • 통계 처리 용이: 점수의 정규분포를 기대하며, 석차 계산에 유용. 3. 장점 • 경쟁과 동기 유발: 경쟁을 통해 외적 학습 동기를 유발함. • 엄격한 변별력: 학생 간의 개인차를 정밀하게 변별할 수 있음. • 객관적 평가: 교사의 주관이나 편견을 배제하고 성적을 처리할 수 있음. 4. 단점 • 교수 학습 개선 어려움: 학습자가 무엇을 모르는지 파악하기 어려움. • 지나친 경쟁: 학습 심리에 부정적 영향을 미치고, 암기 위주의 교육을 조장. • 실패자 양산: 구조적으로 상위권과 하위권이 나뉘어 모두가 우수해질 수 없음을 전제. 5. 준거지향평가(절대평가)와의 차이 규준지향(상대평가): "누가 더 잘했는가?" -> 등수, 석차 준거지향(절대평가): "목표를 달성했는가?" -> 도달 여부
타당도3
조회수: 41. 타당도의 개념 타당도(妥當度, Validity)는 교육평가에서 평가 도구가 측정하고자 하는 내용을 얼마나 정확하게 측정하고 있는지를 나타내는 정도를 의미한다. 즉, 타당도는 평가의 목적과 측정 내용이 얼마나 적절하게 일치하는지를 나타냄으로서 평가가 본래 의도한 학습 목표나 능력을 제대로 측정하고 있는지를 판단하는 개념이다. 교육평가에서 타당도는 신뢰도와 함께 평가의 질을 판단하는 핵심적인 기준으로 간주된다. 예를 들어, 학생의 수학 문제 해결 능력을 평가하려는 시험에서 지나치게 어려운 독해 능력이 요구된다면, 이 평가는 수학 능력보다 읽기 능력의 영향을 더 받을 수 있기 때문에 타당도가 낮다고 볼 수 있다. 2. 타당도의 중요성 - 평가 목적의 정확한 달성 : 평가가 의도한 학습 목표를 제대로 측정하도록 한다. - 공정한 평가 보장 : 평가 결과가 학생의 실제 능력을 반영하도록 한다. - 교육적 의사결정의 근거 제공 : 성적, 진급, 선발 등의 결정이 합리적으로 이루어질 수 있도록 한다. - 교육과정과 수업의 적절성 확인 : 평가 결과를 통해 교수·학습 과정의 효과를 판단할 수 있다. 3. 타당도의 유형 1) 내용 타당도 (Content Validity) 평가 문항이 교육과정이나 학습 목표의 내용을 얼마나 적절하게 반영하고 있는지를 나타낸다. 예를 들어, 한 단원의 핵심 내용이 시험에서 충분히 다루어지지 않았다면 내용 타당도가 낮다고 볼 수 있다. 교육 현장에서는 교과 전문가의 검토나 평가 문항 분석 등을 통해 내용 타당도를 확인한다. 2) 준거 타당도 (Criterion-related Validity) 평가 결과가 외부의 기준(준거)과 얼마나 잘 관련되는지를 나타내는 타당도이다. 준거 타당도는 다시 아래 두 가지 항목으로 나눌 수 있다. 2-1)예언 타당도 (Predictive Validity): 현재 평가 결과가 미래의 성취를 얼마나 잘 예측하는지를 나타낸다. 2-2)동시 타당도 (Concurrent Validity): 같은 시점에서 다른 신뢰할 수 있는 평가 결과와 얼마나 관련되는지를 나타낸다. 3) 구인 타당도 (Construct Validity) 평가가 측정하고자 하는 심리적 특성이나 능력(구인)을 실제로 측정하고 있는지를 판단하는 타당도이다. 예를 들어, 창의성, 학습 동기, 문제 해결 능력과 같은 추상적인 특성을 측정할 때 구인 타당도가 중요하다. 4. 타당도에 영향을 미치는 요인 - 평가 문항의 적절성 - 평가 목표와 문항 내용의 일치 정도 - 시험 환경 및 실시 조건 - 채점 기준의 명확성 - 학생의 시험 태도 및 심리 상태 이러한 요소들이 적절하게 관리될 때 평가의 타당도를 높일 수 있다. 5. 신뢰도와 타당도의 관계 교육평가에서 신뢰도와 타당도는 서로 밀접한 관계를 가진다. - 신뢰도 : 평가 결과의 일관성과 안정성 - 타당도 : 평가가 측정하려는 것을 정확하게 측정하는 정도 일반적으로 신뢰도가 낮은 평가는 타당도가 높을 수 없다. 따라서 신뢰도는 타당도를 확보하기 위한 필요조건이라고 볼 수 있다. 그러나 신뢰도가 높다고 해서 반드시 타당도가 높은 것은 아니다.
신뢰도2
조회수: 31. 신뢰도의 개념 신뢰도(信賴度, Reliability)는 교육평가에서 평가 도구가 얼마나 일관되고 안정적으로 측정 결과를 산출하는지를 나타내는 정도를 의미한다. 즉, 동일한 대상에게 같은 평가를 반복해서 실시했을 때 비슷한 결과가 지속적으로 나타나는 정도를 말한다. 신뢰도는 교육평가의 질을 판단하는 핵심 기준 중 하나로,측정 결과의 일관성과 안정성을 의미하여 평가 결과가 얼마나 믿을 수 있는지를 판단하는 데 중요한 역할을 한다. 예를 들어, 같은 학생이 같은 능력을 가지고 있음에도 불구하고 시험을 볼 때마다 점수가 크게 달라진다면 그 평가는 신뢰도가 낮다고 할 수 있다. 반대로 반복 측정에서도 유사한 결과가 나타난다면 신뢰도가 높은 평가라고 볼 수 있다. 2. 신뢰도의 중요성 - 평가 결과의 신뢰성 확보 : 평가 결과의 신뢰도가 높다면 보다 효과적으로 교육적 의사결정에 활용할 수 있다. - 공정한 평가 보장 : 동일한 능력을 가진 학생이 비슷한 평가 결과를 얻도록 하기 위해 필요하다. - 교육적 판단의 근거 제공 : 성적 산출, 진급, 선발 등 중요한 결정의 기준이 된다. - 평가 도구의 질을 판단하는 기준 : 좋은 평가 도구는 일반적으로 높은 신뢰도를 가진다. 3. 신뢰도의 유형 1) 검사-재검사 신뢰도 (Test-Retest Reliability) 같은 검사를 일정한 시간 간격을 두고 동일한 대상에게 두 번 실시하여 결과의 상관관계를 확인하는 방법이다. 두 검사 결과가 유사할수록 신뢰도가 높다고 판단한다. 2) 동형검사 신뢰도 (Parallel Forms Reliability) 내용과 난이도가 유사한 두 개의 서로 다른 검사(동형 검사)를 만들어 같은 집단에게 실시하고 결과의 상관관계를 통해 신뢰도를 측정하는 방법이다. 3) 반분 신뢰도 (Split-Half Reliability) 하나의 검사를 두 부분으로 나누어 각 부분의 점수 간 상관관계를 통해 신뢰도를 추정하는 방법이다. 예를 들어 홀수 문항과 짝수 문항을 나누어 비교할 수 있다. 4) 문항 내적 일관성 신뢰도 (Internal Consistency Reliability) 검사 문항들이 같은 능력이나 특성을 얼마나 일관되게 측정하는지를 확인하는 방법이다. 대표적으로 크론바흐 알파(Cronbach's α) 계수가 사용된다. 4. 신뢰도에 영향을 미치는 요인 - 문항 수: 문항 수가 많을수록 일반적으로 신뢰도가 높아진다. - 문항의 질: 명확하고 적절한 문항일수록 신뢰도가 높다. - 채점의 객관성: 채점 기준이 명확해야 신뢰도가 높아진다. - 검사 환경: 시험 환경이 안정적일수록 결과의 일관성이 높아진다. - 수험자의 상태: 피로, 긴장 등도 결과에 영향을 줄 수 있다. 5. 신뢰도와 타당도의 관계 교육평가에서 신뢰도는 타당도(Validity)와 밀접한 관계가 있다. - 신뢰도 : 측정 결과의 일관성 - 타당도 : 측정하려는 것을 제대로 측정하고 있는 정도 일반적으로 신뢰도가 낮은 평가는 타당도가 높을 수 없다. 즉, 신뢰도는 타당도의 필요조건이라고 볼 수 있다.
총괄평가4
조회수: 41. 총괄평가의 개념 총괄평가(總括評價, Summative Assessment)는 일정한 학습 과정이 끝난 후 학습자가 얼마나 목표를 달성했는지를 종합적으로 판단하기 위해 실시하는 평가를 의미한다. 단원, 학기, 학년, 교육과정 등의 학습이 끝난 뒤 학습 성취도를 종합적으로 측정하는 평가로, 학습 결과를 확인하고 교육의 성과를 판단하는 데 중요한 역할을 한다. 2. 총괄평가의 목적 - 학습 성취도 확인 : 학생이 교육 목표를 어느 정도 달성했는지 확인한다. - 성적 산출 및 학업 평가 : 성적 부여, 학점 결정, 진급 여부 판단 등에 활용된다. - 교육 프로그램의 효과 검토 : 수업이나 교육과정이 효과적으로 운영되었는지 평가한다. - 교육적 의사결정 자료 제공 : 교육 정책이나 교육과정 개선을 위한 자료로 활용된다. 3. 총괄평가의 특징 - 학습이 끝난 후 실시된다. - 학습 결과 중심의 평가이다. - 성적이나 등급을 산출하는 경우가 많다. - 학생 간 비교나 성취 수준 판단에 활용된다. - 교육적 의사결정(진급, 졸업 등)에 사용된다. 4. 총괄평가의 예 - 학기말 시험 - 기말고사 - 단원 종료 시험 - 국가 수준 학업 성취도 평가 - 대학 입학 시험 5. 총괄평가의 교육적 의의 - 교육 목표 달성 여부를 확인할 수 있다. - 학습 성과를 객관적으로 판단할 수 있다. - 학생의 학업 성취도를 공식적으로 기록할 수 있다. - 교육과정이나 교수 방법의 효과를 검토할 수 있다.
진단평가5
조회수: 41. 진단평가의 개념 진단평가(診斷評價, Diagnostic Assessment)는 학습자의 현재 능력 수준, 선행지식, 학습 결손, 오개념 등을 파악하기 위해 수업이나 학습이 시작되기 전에 실시하는 평가를 의미한다. 교육학에서는 이를 통해 학습자의 출발점을 확인하고, 이후의 교수·학습 활동을 효과적으로 설계하는 것을 중요한 목적으로 본다. 즉, 진단평가는 학습과정 중 진행되는 형성평가, 학습 후 성취결과평가를 위한 총괄평가와 달리 학습 이전 단계에서 교수 전략을 결정하기 위한 정보 수집 활동이라는 점에서 다른 평가와 구별된다. 2. 진단평가의 목적 - 선행학습 수준 파악 : 학생들이 새로운 내용을 학습하기 전에 이미 알고 있는 지식이나 기술의 수준을 확인한다. - 학습 결손 및 오개념 발견 : 학생들이 잘못 이해하고 있는 개념이나 부족한 기초 능력을 찾아낸다. - 개별화된 수업 설계 : 학생들의 수준 차이를 고려하여 교수 방법, 학습 활동, 보충학습 등을 계획할 수 있다. - 학습 집단 분류 및 지원 결정 : 필요에 따라 보충학습, 심화학습, 수준별 수업 등을 운영하기 위한 기초 자료를 제공한다. 3. 진단평가의 특징 - 학습 시작 전에 실시된다. - 점수 자체보다 정보 수집이 중요하다. - 교수·학습 계획 수립에 활용된다. - 학생을 서열화하기 위한 목적이 아니다. - 개별 학생의 학습 문제를 파악하는 데 초점을 둔다. 4. 진단평가의 방법 1) 지필 검사 : 가장 일반적인 방법으로, 객관식·주관식 문항을 통해 학생의 기초 개념이나 선행 지식을 확인한다. 2) 구두 질문 및 면담 : 교사가 질문을 통해 학생의 이해 수준이나 사고 과정을 직접 확인하는 방식이다. 3) 수행 과제 : 문제 해결 활동, 실험, 글쓰기 등 실제 수행을 통해 학습자의 능력을 진단한다. 4) 관찰 : 수업 활동이나 학습 과정에서 나타나는 행동을 관찰하여 학습 준비도를 파악한다. 5. 진단평가의 교육적 의의 - 학생들의 실제 수준에 맞는 수업을 설계하여 효과적인 교수 설계가 가능하도록 한다. - 학습 결손을 조기에 발견하여 보충 지도를 제공할 수 있도록 하여 학습격차를 줄일 수 있다. - 학생 스스로 자신의 강점과 약점을 인식할 수 있도록 도와 자기 이해를 돕는다. 6. 진단평가의 한계 - 평가 문항이 부적절하면 정확한 진단이 어려움. - 학생이 평가 상황에서 실제 능력을 충분히 발휘하지 못할 가능성 존재. - 교사가 결과를 제대로 활용하지 않으면 교육적 효과가 감소
문항내적 합치도
조회수: 51. 핵심 개념 - 논리: "수학 실력을 재는 시험이라면, 1번 문제를 맞힌 사람은 2번 문제도 맞힐 확률이 높아야 한다"는 원리입니다. - 특징: 단 한 번의 검사 실시만으로 신뢰도를 추정할 수 있어 가장 널리 쓰입니다. 2. 주요 측정 지표 ① Cronbach's Alpha - 가장 보편적으로 사용되는 지표 - 특징: 문항이 예/아니오(이분법)뿐만 아니라 리커트 척도(1~5점) 같은 다지선다형일 때도 사용 가능함 - 공식 의미: 문항 간의 평균 상관관계와 문항 수를 고려하여 계산됨 ② KR-20, KR-21 (Kuder-Richardson) - 문항의 정답 여부가 '0'과 '1'(맞음/틀림)로 이분화되어 있을 때 사용함 - KR-20은 문항 난이도가 다를 때, KR-21은 모든 문항의 난이도가 비슷하다고 가정할 때 씀 - 신뢰도에 영향을 주는 요인문항 수: 문항 수가 많아질수록 신뢰도는 높아짐 - 문항 동질성: 측정하고자 하는 내용이 단일할수록(예: 오직 '미분'만 측정) 높아짐 - 검사 범위: 측정 내용의 범위가 좁고 구체적일수록 유리함. - 문항 변별도: 상위권과 하위권을 잘 구분해주는 문항일수록 신뢰도가 올라감 3. 장점 - 반분신뢰도처럼 문항을 반으로 나누는 방식에 따라 값이 달라질 위험이 없음 - 시험을 한 번만 봐도 되므로 경제적이고 연습 효과가 없음 4. 단점 - 속도 검사(시간 제한이 엄격한 시험)에서는 신뢰도가 과대추정될 수 있음 - 문항들이 서로 다른 여러 영역을 포함하고 있으면 신뢰도가 낮게 나옴 5. 신뢰도 계수 판정 기준 (일반적) .90 이상: 매우 높음 (중요한 결정용) .80 ~ .90: 높음 (일반적인 표준화 검사) .70 ~ .80: 수용 가능 (연구용 또는 교실 시험) .60 미만: 낮음 (문항 수정 및 재검토 필요)
반분신뢰도
조회수: 51. 개념 - 신뢰도를 측정하는 방법 중 하나인 반분신뢰도(Split-half Reliability)는 이름 그대로 하나의 검사 도구를 두 부분으로 나누어, 그 두 부분 사이의 일관성을 측정하는 방식임. 2. 측정 방식 - 기우반분법: 홀수 번호 문항들과 짝수 번호 문항들로 나눔. (난이도가 뒤로 갈수록 높아지는 검사에서 효과적) - 전후반분법: 처음부터 중간까지, 그리고 중간부터 끝까지로 나눔. - 난선반분법: 무작위로 문항을 배치하여 반으로 나눔. 이렇게 나눈 두 부분의 점수 간에 상관계수를 계산하여 신뢰도를 산출함. 3. 장점 - 단판 승부: 검사를 한 번만 실시해도 되므로 시간과 비용이 절약됨 - 연습 효과 차단: 재검사 신뢰도처럼 두 번 시험 볼 때 생기는 기억이나 연습 효과가 없음 4. 단점 - 이질성 문제: 문항들이 서로 다른 영역을 측정하고 있다면(다요인 검사), 나누는 방법에 따라 결과가 달라짐 - 과소평가 위험: 문항 수가 줄어든 상태로 계산되므로 반드시 보정 공식이 필요함 5. 주의할 점 (속도검사의 경우) 시간 제한이 엄격한 속도 검사(Speed Test)에서는 반분신뢰도를 쓰지 않는 것이 좋음. 예를 들어, 시간이 부족해서 뒷부분 문항을 거의 못 풀었다면, 홀수/짝수 번호 모두 점수가 낮게 나와 실제보다 신뢰도가 인위적으로 높게 측정될 위험(가짜 신뢰도)이 있기 때문.
역동적 평가
조회수: 51. 개념 - 학습자가 이미 알고 있는 결과물을 측정하는 것이 아니라, 적절한 힌트나 도움을 주었을 때 얼마나 더 발전할 수 있는지(잠재력)를 파악하는 평가 방식임 2. 주요 특징 - 기존의 전통적인 평가(지능 검사, 중간/기말고사)와 비교하면 이해가 빠름 - 진행 방식: '검사-훈련-재검사(Test-Train-Retest)'의 구조를 가짐 - 상호작용: 평가자는 단순한 감독관이 아니라, 학습자에게 힌트를 주거나 질문을 던지는 중재자(Mediator) 역할을 함 - 초점: '무엇을 맞혔는가'보다 '문제를 해결하기 위해 어떤 전략을 쓰는가'와 '도움을 주었을 때 얼마나 빨리 배우는가'를 봄 역동적 평가에서 가장 중요한 개념은 근접발달영역(ZPD)임 - 실제적 발달 수준: 도움 없이 혼자 해결할 수 있는 영역 - 잠재적 발달 수준: 교사나 유능한 또래의 도움을 받아 해결할 수 있는 영역. - ZPD: 이 두 지점 사이의 거리를 의미하며, 역동적 평가는 바로 이 영역을 측정하여 교육의 효율성을 극대화함 3. 장점 및 단점 장점: 일반적인 표준화 검사에서 점수가 낮게 나오는 학생(문화적 차이, 학습 결손 등)의 숨겨진 능력을 발견할 수 있음. 또한 평가 과정 자체가 학습이 되므로 학생의 동기 유발에 좋음. 한계: 평가자(교사)의 역량에 따라 결과가 주관적일 수 있고, 학생 한 명 한 명에게 집중해야 하므로 시간과 비용이 많이 듦 4. 시사점 - 학습 잠재력 확인: 지능 지수(IQ)가 낮게 나온 아이라도, 적절한 중재를 주었을 때 습득 속도가 매우 빠르다면 이 아이는 높은 학습 잠재력을 가진 것으로 재평가됨 - 개별화 교육의 근거: 평가 결과가 점수가 아닌 "이 학생은 시각적 힌트보다 언어적 유추에 더 민감함"과 같은 처방전 형태로 나오기 때문에 실제 가르칠 때 매우 유용함
총괄평가3
조회수: 51. 개념: 교육 과정이나 프로그램이 종료된 후, 목표 달성 여부와 최종 성과를 종합적으로 측정하는 평가입니다. 학습자의 학업 성취도 판정, 성적 부여, 또는 프로그램의 효과성 검증을 목적으로 하며, 장기적이고 전체적인 내용을 다룹니다. 2. 핵심 내용 • 목적: 교수 프로그램의 최종 효과성 검증, 학업 성취도 판정, 성적 및 자격 부여. • 시기: 교육과정, 학기, 또는 단원이 끝나는 시점. 3. 특징 • 포괄성: 넓은 범위의 내용을 평가. • 낮은 빈도: 학기말, 학년말 등 장기적 주기로 실시. • 결과 중심: 학습 과정보다는 최종 결과(성취도)에 집중. 4.활용 학생의 최종 등급 결정, 상위 학년 진급 여부, 교육 프로그램의 존속 여부 결정. 5. 형성평가와의 차이 형성평가가 학습 과정 중의 개선(피드백)에 중점을 둔다면, 총괄평가는 최종 결과 판정에 집중합니다. 주로 학교 현장에서 학기말 시험, 자격 검정 시험, 대규모 학업 성취도 평가 등이 총괄평가의 예시로 활용됩니다
신뢰도
조회수: 5신뢰도란 같은 대상에 대해 두 번 측정해서 얻은 두 개의 측정치 사이에 일관성이 있는지를 의미한다. [신뢰도를 높이는 방법] 1. 문항이 동질적일 때 (반면, 한 검사에 이질적인 성질을 띤 문항이 섞여 있으면 신뢰도 낮아진다.) 2. 문항 변별도가 높을수록 (변별도가 높은 문항이 많은 검사가 변별도가 낮은 문항이 많은 검사보다 신뢰도가 높다. ) 3. 문항 난이도가 중간 정도인 문항 많을수록 (어려운 문항, 쉬운 문항이 많은 것보다, 중간 정도가 많아야 분산도가 크다.) 4. 진술이 명확할 때, 교육목표가 명확할 때 5. 문항의 범위가 좁을 때 (수학에서, 함수에 대한 시험이 수학 교과 전반에 대한 시험보다 더 신뢰도 높다.) 6. 전체 학생을 대상으로 실시할 때 (특정 집단 학생만 하면 신뢰도 낮음 집단의 개인차의 범위가 커지도록 한다.) 7. 검사환경이 일정할 때 (검사 장소의 온도, 밝기, 소음, 시간 등이 일정하면 신뢰도가 높아진다.) 8. 문항수가 많을 때