Initial step is to call the tidyverse library to use with below code.
library(tidyverse)
## -- Attaching packages -------------------------------------------------------------------------------- tidyverse 1.2.1 --
## <U+221A> ggplot2 2.2.1 <U+221A> purrr 0.2.4
## <U+221A> tibble 1.4.2 <U+221A> dplyr 0.7.4
## <U+221A> tidyr 0.8.0 <U+221A> stringr 1.2.0
## <U+221A> readr 1.1.1 <U+221A> forcats 0.2.0
## -- Conflicts ----------------------------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
Then, the 2017 OSYM Data set is loaded.
load("C:/Users/Sezgin/Desktop/osym_data_2017_v2.RData")
The evaluation and analyses of the data will be done with respect to below factors:
names(osym_data_2017)
## [1] "program_id" "university_name" "city"
## [4] "faculty_name" "program_name" "exam_type"
## [7] "general_quota" "general_placement" "min_score"
## [10] "max_score" "val_quota" "val_placement"
## [13] "val_min_score" "val_max_score"
Now let’s see the average of values of minimum and maximum scores of universites and programs.
osym_data_2017 %>% group_by(university_name) %>% summarise(maxmean=mean(max_score), minmean=mean(min_score))
## # A tibble: 200 x 3
## university_name maxmean minmean
## <chr> <dbl> <dbl>
## 1 ABANT İZZET BAYSAL ÜNİVERSİTESİ 340 296
## 2 ABDULLAH GÜL ÜNİVERSİTESİ 468 412
## 3 ACIBADEM MEHMET ALİ AYDINLAR ÜNİVERSİTESİ 404 364
## 4 ADANA BİLİM VE TEKNOLOJİ ÜNİVERSİTESİ 325 281
## 5 ADIYAMAN ÜNİVERSİTESİ 360 298
## 6 ADNAN MENDERES ÜNİVERSİTESİ 328 279
## 7 AFYON KOCATEPE ÜNİVERSİTESİ 324 276
## 8 AĞRI İBRAHİM ÇEÇEN ÜNİVERSİTESİ 358 296
## 9 AHİ EVRAN ÜNİVERSİTESİ 323 278
## 10 AKDENİZ ÜNİVERSİTESİ 364 304
## # ... with 190 more rows
osym_data_2017 %>% group_by(program_name) %>% summarise(maxmean=mean(max_score), minmean=mean(min_score))
## # A tibble: 2,192 x 3
## program_name maxmean minmean
## <chr> <dbl> <dbl>
## 1 Acil Yardım ve Afet Yönetimi 317 270
## 2 Acil Yardım ve Afet Yönetimi (%50 Burslu) 212 191
## 3 Acil Yardım ve Afet Yönetimi (%75 Burslu) 180 180
## 4 Acil Yardım ve Afet Yönetimi (İngilizce) (%50 Burslu) 180 180
## 5 Acil Yardım ve Afet Yönetimi (İngilizce) (Tam Burslu) 227 227
## 6 Acil Yardım ve Afet Yönetimi (İngilizce) (Ücretli) 180 180
## 7 Acil Yardım ve Afet Yönetimi (İÖ) 265 243
## 8 Acil Yardım ve Afet Yönetimi (KKTC Uyruklu) 180 180
## 9 Acil Yardım ve Afet Yönetimi (Tam Burslu) 265 249
## 10 Acil Yardım ve Afet Yönetimi (Ücretli) 180 180
## # ... with 2,182 more rows
We can calculate the averange difference between maximum and minimum scores for the universities in Istanbul.
osym_data_2017 %>% filter(city== "İSTANBUL") %>% group_by(university_name, program_name) %>% summarise(Score_diff=round(mean(abs(max_score-min_score)),1)) %>% ungroup() %>% arrange(desc(Score_diff))
## # A tibble: 3,723 x 3
## university_name program_name Score_diff
## <chr> <chr> <dbl>
## 1 İSTANBUL ÜNİVERSİTESİ Almanca Öğretmenliği (Almanc~ 252
## 2 İSTANBUL ÜNİVERSİTESİ Tarih (Açıköğretim) 235
## 3 İSTANBUL ÜNİVERSİTESİ Coğrafya (Açıköğretim) 233
## 4 İSTANBUL ÜNİVERSİTESİ Jeofizik Mühendisliği 233
## 5 İSTANBUL 29 MAYIS ÜNİVERSİTESİ Tarih (%50 Burslu) 225
## 6 MARMARA ÜNİVERSİTESİ Almanca Öğretmenliği (Almanc~ 222
## 7 YEDİTEPE ÜNİVERSİTESİ Tarih (İngilizce) (%50 Bursl~ 218
## 8 İSTİNYE ÜNİVERSİTESİ Ekonomi (Tam Burslu) 218
## 9 MARMARA ÜNİVERSİTESİ Alman Dili ve Edebiyatı 210
## 10 BAHÇEŞEHİR ÜNİVERSİTESİ Reklamcılık (İngilizce) (Ücr~ 200
## # ... with 3,713 more rows
Assuming the student wants to study in Istanbul, above calculation shows that German Teaching program in Istanbul University has the highest score difference, could be demonstrating that the student has a higher chance to enroll.