Pakker
Laster opp de nødvendige pakkene til valideringsarbeid.
Data
Ferdig renset data fra filen datavask2018.R.
rawdt = readRDS("arskontroll2018.rds")
setDT(rawdt)
Format FDato
til %d-%m-%Y
og lage variabel dob
for fødselsdato med Dato format.
rawdt[, str(FDato)]
rawdt[ ,`:=`(dob = FDato, FDato = format(FDato, "%d-%m-%Y"))]
rawdt[, str(dob)]
Sti til RDS filer for pasient lister for de utvalgte variabler for vasking
sti.vask <- "./datavask/rds"
Funksjoner
Flere funksjoner for å sjekke data og deretter lager Excel-fil det man ønsker. Filen som er laget ligger i sub-mappen ./datavask
.
Missing verdi
Funksjon naTest
for å sjekke missing verdi.
naTest <- function(dt, var, file, save = FALSE, mvar = NULL){
# 'mvar' er for tillegg variabel
# 'var' for missing variabel som skal sjekkes
# "file" for filnavn f.eks file.xlsx
if (!is.null(mvar)) {
var.list <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospital", var, mvar)
} else {
var.list <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospital", var)
}
dtMiss <- dt[is.na(get(var)), ..var.list]
# dtMiss[, FDato := format(FDato, "%d-%m-%Y")][]
setkey(dtMiss, hospital)
if(save){
openxlsx::write.xlsx(dtMiss, file.path("./datavask",
paste(format(Sys.Date(), "%Y%m%d"), file, sep = "_"),
fsep = '/'),
asTable = TRUE, colWidths = "auto")
}
return(dtMiss)
}
Lager sykehus ID
Lager alternativ ID til å bruke i loop.
listHosp <- unique(rawdt$hospital)
hosDT <- data.table(hospital = sort(listHosp), hospID = 1:length(listHosp))
setkey(hosDT, hospID)
# saveRDS(hosDT, "hospitalID.rds")
# hosDT <- readRDS("hospitalID.rds")
hosDT
hosNavnKort <- c("Akershus", "Forde", "Haugesund", "Haukeland", "Sandessjoen", "Finnmark",
"Kristiansund", "Molde", "Namsos", "Bodo", "Trondheim",
"Stavanger", "Vestfold", "Gjovik", "Lillehammer", "Elverum", "Levanger",
"Telemark",
"Ostfold",
"Arendal",
"Kristiansand",
"Ulleval",
"Nord_norge",
"Harstad",
"Drammen",
"Alesund")
# hosDT[, kortID := hospID]
# hosDT[.(kortID = 1:26, to = hosNavnKort), on = "kortID", hosKort := i.to]
hosDT[.(hospID = 1:26, to = hosNavnKort), on = "hospID", hosKort := i.to]
Merge hospID
i datasettet
setkey(hosDT, hospital)
setkey(rawdt, hospital)
dt <- hosDT[rawdt, on = "hospital"]
setkey(dt, hospID)
Objekt per sykehus
Lage objekt for hvert sykehus som en LIST.
# hospList <- unique(dt$hospital)
hospObj <- function(x){
listHos <- unique(x$hospID)
hospLIST = list()
for (i in listHos) {
hospLIST[[i]] <- x[hospID == i, ]
}
return(hospLIST)
}
Sjekk verdi
For å sjekke at verdi skal være et vist nivå.
chkVerdi <- function(x, var, verdi, over = TRUE, mvar = NULL, all = FALSE){
# var : valgte variabel som skal sjekkes
# over : skal verdien over eller under
# mvar : tillegg variabler som skal inkluderes i output
# all : er det bare de med T1D eller alle i datasettet
# standard variabler å ha
if (is.null(mvar)){
std.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", var)
} else {
std.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", var, mvar)
}
if (all == FALSE) {
xt <- x[diabetes_Type1 == "Ja", ]
} else {
xt = x
}
if (over == TRUE){
.chkdt <- xt[get(var) > verdi, ..std.var]
} else {
.chkdt <- xt[get(var) < verdi, ..std.var]
}
return(.chkdt)
}
Person variabler
Lager objekt som inneholder alle person variabler
person.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital")
Nasjonalitet
Viser nasjonalitet.
list.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", "Nasjonalitet", "nasMor", "nasFar")
dtNasj <- dt[is.na(Nasjonalitet), list.var, with = FALSE]
setkey(dtNasj, hospID)
dim(dtNasj)
# openxlsx::write.xlsx(dtNasj, file.path("./datavask",
# paste(format(Sys.Date(), "%Y%m%d"), "Nasjonalitet.xlsx", sep = "_"),
# fsep = '/'),
# asTable = TRUE, colWidths = "auto")
Retting
Koblet fra Excel fil med lister over missing nasjonalitet som Siv Janne har rettet.
xlNasj <- rio::import("./datavask/arkiv/20190507_Nasjonalitet.xlsx")
names(xlNasj)
str(xlNasj)
setDT(xlNasj)
setkey(xlNasj, Pnr)
dim(xlNasj)
xlNasj[is.na(Nasjonalitet), .N]
Koblet xlsx
Koblet filen Siv Janne rettet med utrekk fra eReg.
dtNasj2 <- xlNasj[dtNasj, on = c(Pnr = "Pnr")]
dim(dtNasj2)
names(dtNasj2)
# beholder variabler fra Excel som ble utfylt av Siv Janne
i.navn <- grep("^i.*", names(dtNasj2), value = T)
dtNasj2[, (i.navn) := NULL]
names(dtNasj2)
dtNasj2[is.na(Nasjonalitet), .N]
Koble fil med den grønne databasen
Koble direkte til Access DB, men fikk ikke til å fungere.
grennDB <- odbcDriverConnect("Driver={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=K:\\Sensitivt\\Forskning02\\Barnediabetesregisteret_2015-5739\\Nyoppdaget diabetes\\Nyoppdaget_Type_1_diabetes_kopi.mdb")
Den grønne databasen som excelfil
greenPath <- "K:\\Sensitivt\\Forskning02\\Barnediabetesregisteret_2015-5739\\Barnediabetes og kvalitet\\Datafiler\\accessfil"
greenDT <- rio::import(file.path(greenPath, "20190507_greendb.xlsx", fsep = "\\"))
data.table::setDT(greenDT)
fdt <- grep("selsdato", names(greenDT), value = T)
greenDT[, Pnr := as.numeric(sprintf("%s%s", format(get(fdt), "%d%m%y"), Personnr))]
names(greenDT)
setkey(greenDT, Pnr)
greenSelect <- greenDT[, .(Pnr, Personnr, Fornavn, Etternavn, Etnisk_bakgr_pas, Etnisk_bakgr_mor, Etnisk_bakgr_far)]
Koble missing nasjonalitet med Grønn Access hvis de finnes info om nasjonalitet der.
names(dtNasj2)
setkey(dtNasj2, Pnr)
db2db <- greenSelect[dtNasj2, on = c(Pnr = "Pnr")]
db2db[!is.na(Etnisk_bakgr_pas), .N]
Koble info om nasjonalitet fra den grønne
db2db[is.na(Nasjonalitet), .N]
db2db[is.na(Nasjonalitet), Nasjonalitet := Etnisk_bakgr_pas] # Nasjonalitet
db2db[is.na(nasMor), nasMor := Etnisk_bakgr_mor] # Nasj. mor
db2db[is.na(nasFar), nasFar := Etnisk_bakgr_far] # Nasj. far
Beholder bare variable som kommer fra eReg
dtNasj3 <- db2db[ , ..list.var]
dtNasj3[, FDato := format(FDato, "%d-%m-%Y")]
dim(dtNasj3)
dtNasj3[is.na(Nasjonalitet), .N]
Lager renset missing Nasjonalitet og koblet med grønn datasettet.
saveRDS(dtNasj3, "./datavask/renset/nasjonalitet.rds")
# dtNasj3 <- readRDS("./datavask/renset/nasjonalitet.rds")
Merge tilgengelige nasjonalitet fra grønn datasettet og halv bearbeid Excel fra Siv Janne til hele datasettet.
names(dtNasj3)
kob_nasj <- dtNasj3[, .(Pnr, Nasjonalitet, nasMor, nasFar)] #velger relevant variabler for nasjonlitet
# Dtt <- copy(dt)
dt[dtNasj3, Nasjonalitet := ifelse(is.na(Nasjonalitet), i.Nasjonalitet, Nasjonalitet), on = "Pnr"] #erstater missing Nasjonalitet
# Dtt[is.na(Nasjonalitet), Nasjonalitet := dtNasj3[.SD, Nasjonalitet, on = "Pnr"]]
dt[dtNasj3, nasMor := ifelse(is.na(nasMor), i.nasMor, nasMor), on = "Pnr"] #erstater missing nasMor
dt[dtNasj3, nasFar := ifelse(is.na(nasFar), i.nasFar, nasFar), on = "Pnr"] #erstater missing nasFar
Liste pasienter som fortsatt mangler info for Nasjonalitet per sykehus
dtNasj4 <- dtNasj3[is.na(Nasjonalitet), ]
chk_Nasj <- hospObj(dtNasj4)
saveRDS(chk_Nasj, file.path(sti.vask, "chk_Nasj.rds"))
HbA1c
Variabelnavn lab_HbA1cAkerVerdi
. Sjekk antall missing, HbA1c < 4 og > 15.
# hba1c = validator(.file = 'hba1c.yaml')
v_hba <- validator(
lab_HbA1cAkerVerdi > 4
, lab_HbA1cAkerVerdi < 15
, !is.na(lab_HbA1cAkerVerdi)
)
c_hba <- confront(dt, v_hba, key = "Pnr")
summary(c_hba)
# dthba <- as.data.frame(c_hba)
# setDT(dthba)
# dthba[, .N, by=list(expression, value)]
# dtt = aggregate(c_hba, by='record')
# setDT(dtt)
# dtt$
# dtt[rel.fail==1, ]
barplot(c_hba, main = "HbA1c verdi")
Lager Excel fil for missing verdi HbA1c.
Liste pasienter med missing HbA1c per sykehus
chk_hba1c <- hospObj(NA_hba1c)
saveRDS(chk_hba1c, file.path(sti.vask, "chk_hba1c.rds"))
Diabetes Type
Missing diabetes Type
Sjekk missing diabetes type inkludert insulinbehandling. Hvis det er Type 1 så må det være en av de insulinbehandlingene svart JA.
DTtype <- dt[is.na(diabetes_Type1) & is.na(diabetes_Type2) & is.na(diabetes_Mody) & is.na(diabetes_AnnenDiabetes),
c(person.var,
"diabetes_Type1",
"diabetes_Type2",
"diabetes_Mody",
"diabetes_AnnenDiabetes",
"beh_ferdig_bland",
"beh_ins_beh",
"beh_ins_pumpe"), with=FALSE]
DTtype
setkey(DTtype, hospID)
chk_diabtype <- hospObj(DTtype)
saveRDS(chk_diabtype, file.path(sti.vask, "chk_diabtype.rds"))
# openxlsx::write.xlsx(DTtype, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "diabetesType.xlsx", sep = "_"), fsep = '/'),
# asTable = TRUE, colWidths = "auto")
Diet og diabetes Type 1
Hvis det er diett så kan det ikke være diabetes Type 1.
dt[beh_diett == "Ja", .N, by=.(diabetes_Type1)]
diet1 <- dt[diabetes_Type1 == "Ja" & beh_diett == "Ja", c(person.var, "diabetes_Type1", "beh_anti_tab", "beh_diett"), with=F]
diet1
Hvis bruker antidiabetes tabeletter kan ikke være diabetes Type 1.
dt[beh_anti_tab == "Ja", .N, by=.(diabetes_Type1)]
diet2 <- dt[diabetes_Type1 == "Ja" & beh_anti_tab == "Ja", c(person.var, "diabetes_Type1", "beh_anti_tab", "beh_diett"), with=F]
diet2
Koble de to sammen
diet22 <- diet2[!diet1, on="Pnr"] #ekluderer den som finnes på begge
diet22
diet12 <- rbindlist(list(diet1, diet22))
Lager liste
chk_diet <- hospObj(diet12)
saveRDS(chk_diet, file.path(sti.vask, "chk_diet.rds"))
Vekt og høyde
Kontrollerer at Høyde under 2 meter og Vekt under 100 kg. Variabel BMI
lages med formel: \[\frac{Vekt(kg)}{Høyde(m)^2}\]
Lager __BMI_ variabel.
## BMI
dt[!is.na(inn_Vekt) & !is.na(inn_Lengde), bmi := (inn_Vekt/inn_Lengde/inn_Lengde)*10000]
Sjekk antall for unvanlige tall bl.a høyde, vekt og bmi.
## validering
v_kg = validator(
inn_Lengde > 10,
inn_Lengde < 200,
inn_Vekt > 20,
inn_Vekt < 100,
BMI := (inn_Vekt/inn_Lengde/inn_Lengde)*10000,
BMI < 30,
BMI < 35,
BMI > 11
)
con_kg = confront(dt, v_kg, key="Pnr")
# con_kg
summary(con_kg)
barplot(con_kg, main = "Vekt, Høyde og BMI")
Høyde under 10 cm
dt[inn_Lengde < 10, person.var, with=F]
BMI under 11
bmi_pas.list=c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", "inn_Lengde", "inn_Vekt")
pasBMI_11 <- dt[bmi < 12, ..bmi_pas.list]
setkey(pasBMI_11, hospID)
dim(pasBMI_11)
chk_bmi_under12 <- hospObj(pasBMI_11)
saveRDS(chk_bmi_under12, file.path(sti.vask, "chk_bmi_under12.rds"))
#
# openxlsx::write.xlsx(pasBMI, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"),
# "bmi_under11.xlsx", sep = "_"), fsep = '/'),
# asTable = TRUE, colWidths = "auto")
BMI over 35
pasBMI35 <- dt[bmi > 35, ..bmi_pas.list]
dim(pasBMI35)
chk_bmi_over35 <- hospObj(pasBMI35)
saveRDS(chk_bmi_over35, file.path(sti.vask, "chk_bmi_over35.rds"))
Alder
Sjekk minimum alder under 0 og maksimum over 18 år. Variabel alder
må lages først.
Validerings data
v_age <- validator(
alder > 0,
alder < 19
)
c_age <- confront(dt, v_age, key="Pnr")
summary(c_age)
Plotting valideringsdata
barplot(c_age, main = "Alder under 0 og over 18 år")
Liste av pasienter over 19 år per sykehus.
alder19 <- dt[alder > 18.999, c(person.var, "inn_Dato", "alder"), with=F]
dim(alder19)
chk_alder19 <- hospObj(alder19)
saveRDS(chk_alder19, file.path(sti.vask, "chk_alder19.rds"))
Diabetesvarighet
Diabetesvarighet definert som lengde fra diagnose dato inn_DiagDato
til kontroll tidspunktet inn_Dato
. Ny variabel lages for diabetesvarighet som heter diagVar
.
dt[, diagVar := as.numeric(round(as.period(interval(diagDato, inn_Dato)/duration(n=1, unit="years")), digits = 1))]
Sjekk for diabetesvarighet under 0 år.
c_diagv <- check_that(dt, diagVar > 0)
summary(c_diagv)
validate::aggregate(c_diagv)
head(aggregate(c_diagv, by='record')) #see hvilken linje som har feil
sort(c_diagv) # se hvilken verdi som gjør feilen
List av pasienter
varighet0 <- dt[diagVar < 0.0007, c(person.var, "diagDato", "inn_Dato", "diagVar"), with=F]
dim(varighet0)
chk_varihet0 <- hospObj(varighet0)
saveRDS(chk_varihet0, file.path(sti.vask, "chk_varihet0.rds"))
Menarche
Alder ved menarche. Sjekk for minimun alder av 9 år og maksimum av 16.5 år. Ny variabel alderArc
lages. OBS! husk dob brukes for fødselsdato siden FDato er string.
dt[!is.na(inn_MenarcheTidspunkt),
alderArc := as.numeric(round(as.period(interval(dob, inn_MenarcheTidspunkt)/duration(n=1, units = 'years')),
digits = 1))]
Validering for alderArc
.
v_ageMrch <- validator(
alderArc > 9,
alderArc < 16.5
)
c_ageMrch <- confront(dt, v_ageMrch)
Tabell for antall som er under 9 år og over 16.5 år.
summary(c_ageMrch)
Liste over pasienter med menarche under 9 år.
Liste over pasienter med menarche over 16.5 år.
Diagnose Alder
Diagnose alder min 0 og max 18 år. Først lage variabel diagAlder.
dt[, diagAlder := as.numeric(round(as.period(interval(dob, diagDato)/duration(n=1, units = 'years')), digits = 1))]
v_alderDiag <- validator(
diagAlder > 0,
diagAlder < 18
)
c_alderDiag <- confront(dt, v_alderDiag)
sort(c_alderDiag) # se på verdier for å være feil
summary(c_alderDiag)
List over pasienter for diagnose alder som ikke møter forventingene. Diagnose alder under 1 år.
diagAlder0 <- dt[diagAlder < 0.9, c(person.var, "diagDato", "diagAlder", "diabetes_Type1"), with=F]
dim(diagAlder0)
setkey(diagAlder0, hospID)
chk_diagAlder0 <- hospObj(diagAlder0)
saveRDS(chk_diagAlder0, file.path(sti.vask, "chk_diagAlder0.rds"))
Blodtrykk
Systolisk skal ikke være over 140 og diastolisk skal ikke være under 45
v_blodtrykk <- validator(
inn_Blodtrykk_s < 140,
inn_Blodtrykk_d > 45
)
c_blodtrykk <- confront(dt, v_blodtrykk)
summary(c_blodtrykk)
Lister over pasienter som ikke møter kravet.
blodtrk_s <- dt[inn_Blodtrykk_s > 140, c(person.var, "inn_Blodtrykk_s", "inn_Blodtrykk_d"), with=F]
blodtrk_d <- dt[inn_Blodtrykk_d < 45, c(person.var, "inn_Blodtrykk_s", "inn_Blodtrykk_d"), with=F]
blodtrk <- rbindlist(list(blodtrk_d, blodtrk_s), use.names = TRUE)
setkey(blodtrk, hospID)
chk_blodtrykk <- hospObj(blodtrk)
saveRDS(chk_blodtrykk, file.path(sti.vask, "chk_blodtrykk.rds"))
LDL
Liste over alle LDL som er >=2.6
. Bruk LDL ikke fastende lab_lip_LDL_2
, men hvis missing fastende LDL skal brukes hvis det finnes lab_lip_LDL
.
Lager variabel ldl3 for ikke fastende LDL og legger til fastende hvis missing.
dt[, lapply(.SD, str), .SDcols = c("lab_lip_LDL_2", "lab_lip_LDL")]
dt[ , ldl3 := lab_lip_LDL_2][is.na(lab_lip_LDL_2), ldl3 := lab_lip_LDL]
dt[is.na(lab_lip_LDL_2), .N]
dt[is.na(ldl3), .N]
Sjekk antall som er over og lik 2.6.
v_ldl <- validator(
ldl3 <= 2.6,
ldl3 < 2.7
)
c_ldl <- confront(dt, v_ldl)
sort(c_ldl)
summary(c_ldl)
Liste pasienter
ldl26 <- dt[ldl3 >=2.6, c(person.var, "lab_lip_LDL_2", "lab_lip_LDL"), with=F]
dim(ldl26)
setkey(ldl26, hospID)
chk_LDL26 <- hospObj(ldl26)
saveRDS(chk_LDL26, file.path(sti.vask, "chk_LDL26.rds"))
Behandling
Forskjellige variabler for behandling av diabetes. Gjelder bare for T1D.
Multiinjuksjon
Gjelder bare for pasienter med T1D. Superhurtigvirkende beh_ins_beh_hurtig_ie_dogn
plus langtidsvirkende beh_ins_beh_lang_ie_dogn
del med kroppsvekt inn_Vekt
. Normal verdi skal være < 2.
dt[, str(.SD), .SDcols = c("beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn", "inn_Vekt")]
# dt[, lapply(.SD, str), .SDcols = c("beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn")]
Endre NA i begge variablene til 0. Lager variabel multinj for summan av superhurtigvirkende og langtidsvirkende behandling og del med kroppsvekt.
dt[ , beh_hurtigNA0 := beh_ins_beh_hurtig_ie_dogn][is.na(beh_hurtigNA0), beh_hurtigNA0 := 0]
dt[ , beh_langtidNA0 := beh_ins_beh_lang_ie_dogn][is.na(beh_langtidNA0), beh_langtidNA0 := 0]
dt[, multinj := round((beh_hurtigNA0 + beh_langtidNA0)/inn_Vekt, digits = 2)]
dt[, .(beh_ins_beh_hurtig_ie_dogn, beh_ins_beh_lang_ie_dogn, inn_Vekt, multinj)]
Liste pasienter. Gjelder bare pasienter med T1D.
beh_multi <- dt[diabetes_Type1=="Ja" & multinj > 2, c(person.var, "beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn", "inn_Vekt"), with=F]
dim(beh_multi)
setkey(beh_multi, hospID)
chk_multi <- hospObj(beh_multi)
saveRDS(chk_multi, file.path(sti.vask, "chk_multi.rds"))
Insulinpumpe
Normal verdig skal ikke være < 2
dt[, str(.SD), .SDcols = c("beh_ins_type_ie_basal", "beh_ins_type_ie_bolus", "inn_Vekt")]
Endre NA i begge variablene til 0. Lager variabel pumpe for summan av superhurtigvirkende og langtidsvirkende behandling og del med kroppsvekt.
dt[ , beh_basalNA0 := beh_ins_type_ie_basal][is.na(beh_basalNA0), beh_basalNA0 := 0]
dt[ , beh_bolusNA0 := beh_ins_type_ie_bolus][is.na(beh_bolusNA0), beh_bolusNA0 := 0]
dt[, pumpe := round((beh_basalNA0 + beh_bolusNA0)/inn_Vekt, digits = 2)]
dt[, .(beh_ins_type_ie_basal, beh_ins_type_ie_bolus, inn_Vekt, pumpe)]
Lister av pasienter med T1D
beh_pumpe <- dt[diabetes_Type1 == "Ja" & pumpe > 2, c(person.var,"beh_ins_type_ie_basal", "beh_ins_type_ie_bolus", "inn_Vekt"), with=F]
dim(beh_pumpe)
chk_pumpe <- hospObj(beh_pumpe)
saveRDS(chk_pumpe, file.path(sti.vask, "chk_pumpe.rds"))
Pumpe annet
Variabelnavn beh_ins_pumpe_annet
er en fritekst. De må standardiseres.
pumpeDT
pumpe_ny beh_ins_pumpe_annet pumpe_all
1: Medtronic Minimed 640G MINIMED 640G Medtronic Minimed 640G
2: Roche? Spirit Combo accu check combo spirit Roche Spirit Combo
3: Roche? accu-check Roche
4: Medtronic Paradigme Veo PARADIGM Medtronic Paradigme Veo
5: Roche? Spirit Combo ACCU CHECK SPIRIT COMBO Roche Spirit Combo
6: Roche? Spirit Combo ACCU CHECK COMBO SPRIT Roche Spirit Combo
7: Roche? accucheck Roche
8: Medtronic Paradigme Veo paradigm Medtronic Paradigme Veo
9: Medtronic Minimed 640G MINIMED 640 G Medtronic Minimed 640G
10: Roche? Spirit Combo accu-chech combo spirit Roche Spirit Combo
11: Roche Insight Accucheck inlight Roche Insight
12: Roche? accocheck Roche
13: Roche? Accu-check aviva Roche
14: Medtronic Minimed 640G Metronic Minimed 640g Medtronic Minimed 640G
15: Medtronic Paradigme Veo Medtronic Paradign Medtronic Paradigme Veo
16: Roche? Accucheck Roche
17: Roche? Accu Check Roche
18: Medtronic Minimed 640G Medtronic Minimed 640 G Medtronic Minimed 640G
19: Roche? ACCU Check Roche
20: Medtronic Minimed 640G Medtronic Minimed 640G Medtronic Minimed 640G
21: Animas Vibe Animas Vibe Animas Vibe
22: Medtronic Paradigme Veo Medtronic Paradigme Veo Medtronic Paradigme Veo
23: Medtronic Medtronic Mini Med Medtronic
24: Omnipod Omnipod Omnipod
25: Medtronic Minimed 640 G Medtronic 640 G Medtronic Minimed 640 G
26: ukjent ukjent ukjent
27: Roche? Spirit Combo Spirit Combo Roche Spirit Combo
28: Medtronic 715 Medtronic 715 Medtronic 715
29: Omnipod Ominpod Omnipod
30: Omnipod Omipod Omnipod
31: Roche Insight Accucheck Insight Roche Insight
32: Roche? Spirit Combo ACCU CHECK COMBO SPIRIT Roche Spirit Combo
33: Roche? Spirit Combo Accucheck Combo Spirit Roche Spirit Combo
34: Roche? Spirit Combo Accu chek cambo spirit Roche Spirit Combo
35: Roche? Spirit Combo Accu chek combospint Roche Spirit Combo
36: Roche Insight Accu chek Insight Roche Insight
37: Roche Insight Accu chek linsight Roche Insight
38: Roche Insight Roche Insight Roche Insight
39: Medtronic Paradigme Veo Medtronic Paradigme Medtronic Paradigme Veo
40: Medtronic Minimed 640G Medtronic Minimed (fra nov.17) Medtronic Minimed 640G
41: Medtronic Minimed 640G multimed640 Medtronic Minimed 640G
42: Medtronic Paradigme Veo Paradigm Veo Medtronic Paradigme Veo
43: Medtronic Paradigme Veo paradigme Medtronic Paradigme Veo
44: Medtronic? Minimed 640G multimed 640g Medtronic Minimed 640G
45: Medtronic? Minimed 640G minimed 640g Medtronic Minimed 640G
46: Medtronic? Minimed 640G multimed Medtronic Minimed 640G
47: Medtronic? Minimed 640G Medtronic 640G Medtronic Minimed 640G
48: Medtronic? Minimed 640G Minimed40g Medtronic Minimed 640G
49: Medtronic? Minimed 640G multimed 640G Medtronic Minimed 640G
50: Medtronic Paradigme Veo veo Medtronic Paradigme Veo
51: Medtronic? Minimed 640G multimed640 g Medtronic Minimed 640G
52: Roche? Accu check Roche
53: Roche? Accu-Chek Roche
54: Roche? accu check Roche
pumpe_ny beh_ins_pumpe_annet pumpe_all
Merge de nye standardiserte navnene til hele datasettet.
dt[.(beh_ins_pumpe_annet = pumpeOld, to = pumpeNy), on = "beh_ins_pumpe_annet", pumpe_txt := i.to ]
Injeksjoner hurtigvirk
Antall injeksjoner hurtigvirkende insulin per døgn. Den skal ikke være mer en 10
str(dt$beh_ins_beh_hurtig_inj_dogn)
Liste over pasienter med verdi over 10.
injek.dt <- chkVerdi(dt, "beh_ins_beh_hurtig_inj_dogn", verdi = 10)
dim(injek.dt)
chk_injek <- hospObj(injek.dt)
saveRDS(chk_injek, file.path(sti.vask, "chk_injek.rds"))
Injeksjoner langtidvirk
Antall injeksjoner langtidsvirkende insulin per døgn. Den skal ikke være mer enn 2
str(dt$beh_ins_beh_lang_ie_dogn)
Liste over pasienter
injek.lang <- chkVerdi(dt, "beh_ins_beh_lang_inj_dogn", verdi = 2)
dim(injek.lang)
Bolusdoser
Antall bolusdoser per døgn. Den skal ikke være mer enn 12.
str(dt$beh_ins_tot_enh_dogn_bolus)
bolusdos <- chkVerdi(dt, "beh_ins_tot_enh_dogn_bolus", verdi = 12)
dim(bolusdos)
chk_bolusdos <- hospObj(bolusdos)
saveRDS(chk_bolusdos, file.path(sti.vask, "chk_bolusdos.rds"))
Nålskifte
Antall nålskifte. Skal ikke være mer enn 5
str(dt$beh_ins_nal_skift_dogn)
Liste over pasienter
nalskift <- chkVerdi(dt, "beh_ins_nal_skift_dogn", verdi = 5)
dim(nalskift)
setkey(nalskift, hospID)
chk_nalskift <- hospObj(nalskift)
saveRDS(chk_nalskift, file.path(sti.vask, "chk_nalskift.rds"))
Albuminundersøkelse
Urin prøve missing
Sjekk for mangler eller missing for urinprøve lab_res_1prove
. Hvis missing skal det sjekkes om de er riktig missing ved å se at det ble besvart NEI for lab_urinprove
eller at det var skrevet årsak i lab_urinprove_hvorfor
.
dt[, str(.SD), .SDcols = c("lab_res_1prove", "lab_urinprove", "lab_urinprove_hvorfor")]
Pasient lister
urinprov <- dt[is.na(lab_res_1prove), ][!is.na(lab_urinprove_hvorfor) | lab_urinprove == TRUE, c(person.var, "lab_res_1prove"), with=F]
dim(urinprov)
setkey(urinprov, hospID)
chk_urinprove <- hospObj(urinprov)
saveRDS(chk_urinprove, file.path(sti.vask, "chk_urinprove.rds"))
Albumin/kreatinin
Henter kategoriske variabelnavn lab_res_1menhet
siden den ikke er kodet i tall.
mgmol <- grep("^mg/mmol", dt$lab_res_1menhet, value = T)[1]
mgl <- grep("^mg/l", dt$lab_res_1menhet, value = T)[1]
mg/mmol
Hvis (lab_res_1menhet) = 2 (mg/mmol) skal (lab_res_1prove) skal det IKKE være >=2.5.
mgmol.dt <- dt[lab_res_1menhet == mgmol, ]
mgmol.sub <- chkVerdi(mgmol.dt, var = "lab_res_1prove", verdi = 2.4999)
dim(mgmol.sub)
chk_mgmol <- hospObj(mgmol.sub)
saveRDS(chk_mgmol, file.path(sti.vask, "chk_mgmol.rds"))
mg/l
Hvis (lab_res_1menhet) = 1 (mg/l) skal (lab_res_1prove) skal det IKKE være >=30
mgl.dt <- dt[lab_res_1menhet == mgl, ]
mgl.sub <- chkVerdi(mgl.dt, var = "lab_res_1prove", verdi = 29.9999)
dim(mgl.sub)
chk_mgl <- hospObj(mgl.sub)
saveRDS(chk_mgl, file.path(sti.vask, "chk_mgl.rds"))
mikrog/min
Hvis (lab_res_1menhet) = 3 (mikrog/min) skal (lab_res_1prove) skal det IKKE være >=20
dt[, .N, by=.(lab_res_1menhet)]
Ikke gjort fordi ingen har den verdien.
Persisterende microalbumniuri
Hvis svar til variabel lab_res_persmikro
er JA, tar ut liste av pasienter.
permicro <- dt[lab_res_persmikro == "Ja", c(person.var, "lab_res_persmikro"), with=F]
dim(permicro)
chk_permicro <- hospObj(permicro)
saveRDS(chk_permicro, file.path(sti.vask, "chk_permicro.rds"))
Insulinsjokk
Sjekk at und_inssjokk_ant
er IKKE mer enn 8
str(dt$und_inssjokk_ant)
dt[und_inssjokk_ant > 8, .(und_inssjokk_ant, hospital)]
ins_sjokk <- chkVerdi(dt, "und_inssjokk_ant", verdi = 8)
dim(ins_sjokk)
chk_inssjokk <- hospObj(ins_sjokk)
saveRDS(chk_inssjokk, file.path(sti.vask, "chk_inssjokk.rds"))
DKA
Sjekk at und_ketoacidose_ant
er IKKE mer en 5
str(dt$und_ketoacidose_ant)
Liste av pasienter
ketdose <- chkVerdi(dt, "und_ketoacidose_ant", verdi = 5)
dim(ketdose)
chk_dka <- hospObj(ketdose)
chk_dka
Følinger
Sjekk at und_foling_ant
er IKKE mer enn 10
str(dt$und_foling_ant)
Liste over pasienter
foling.dt <- chkVerdi(dt, "und_foling_ant", 10)
dim(foling.dt)
chk_foling <- hospObj(foling.dt)
saveRDS(chk_foling, file.path(sti.vask, "chk_foling.rds"))
Undersøkelse
dt[, .N, by=.(und_laser)]
dt[, .N, by=.(und_Retinopati)]
dt[, .N, by=.(und_Retinopati_valg)]
dt[, .N, by=.(und_periferneu)]
Laserbehandling
Liste for alle som svarte JA
laserJa <- dt[und_laser == "Ja", c(person.var, "und_laser"), with=F]
dim(laserJa)
chk_laserJa <- hospObj(laserJa)
saveRDS(chk_laserJa, file.path(sti.vask, "chk_laserJa.rds"))
Retinopati
Liste over alle som svarte Ja på und_Retinopati
og har svart på und_Retinopati_valg
retino1 <- dt[und_Retinopati == "Ja", c(person.var, "und_Retinopati", "und_Retinopati_valg"), with=F]
retino2 <- dt[!is.na(und_Retinopati_valg), c(person.var, "und_Retinopati", "und_Retinopati_valg"), with=F]
ret11 = retino1[!retino2, on = "Pnr"] #pasient som befinnes bare i retino1
retino12 <- rbindlist(list(ret11, retino2))
dim(retino12)
chk_retino <- hospObj(retino12)
saveRDS(chk_retino, file.path(sti.vask, "chk_retino.rds"))
Perifer neuropati
Liste over alle som svarte JA
dt[, .N, by=.(und_periferneu)]
Liste av pasienter
perif.dt <- dt[und_periferneu == "Ja", c(person.var, "und_periferneu"), with=F]
dim(perif.dt)
chk_perineuro <- hospObj(perif.dt)
saveRDS(chk_perineuro, file.path(sti.vask, "chk_perineuro.rds"))
Pasienter med flere årskontroll
Disse er pasienter som gjennomført årskontroll mer enn to ganger. Årskontroll skal bare telles en gang. Derfor skal det være KUN en årskontroll per pasient og sykehuset må kontaktes for å bekrefte hvilket av dem skal beholdes.
dim(dt)
dt[duplicated(Pnr), .(Pnr)]
dt[PasientID == 7071, .(PasientID, Pnr, OppholdID, hospital, FNavn, ENavn, diagDato, diabetes_Type1, inn_Dato, yr)]
sykehus i Vestfold har bekreftet at årskontroll som var tatt i 18.04.2018 er den gjeldene.
dt <- dt[OppholdID != 115449, ]
dim(dt)
Pasienter med ingen eller flere diagnoser
Noen pasienter har blitt registrert med flere diagnoser eller ingen. Hvem er disse? Når liste av pasienter er laget så skal Siv Janne kontakter sykehusene for varifisering.
## Demografisk variabler
demoVar <- c("PasientID", "Pnr", "hospital", "hospID", "hosKort", "alder", "Kjonn", "diagVar", "diagAlder")
## diabetes variabler
diabetesVar = c("diabetes_Type1", "diabetes_Type2", "diabetes_Mody", "diabetes_Kir62", "diabetes_SekDiabetes", "diabetes_AnnenDiabetes", "diabetes_UkjentDiabetes")
## lage subset
diabDT <- dt[, c(demoVar, diabetesVar), with = F]
## trim whitespace
##-----------------------
for (j in diabetesVar){
if(class(diabDT[[j]]) == 'character')
set(diabDT, j = j, value = trimws(diabDT[[j]]))
}
## ## vanlig loop for whitespace deletion. OBS!! Treggere enn loop set
## for (j in diabetesVar){
## diabDT[, (j) := trimws(get(j))]
## }
## Check whitespace er borte
diabDT[Pnr == 7090197481, .(diabetes_Kir62)][[1]]
## ## måtte gjøre det nesten manuelt siden trimws for alle kolonne i data.table ikke
## ## funker som det bør være
## diabDT[!is.na(diabetes_Kir62), diabetes_Kir62 := trimws(diabetes_Kir62)]
## Lage en long dataset
diabLg <- melt(data = diabDT,
id.vars = demoVar,
measure.vars = diabetesVar,
variable.name = "diabType",
value.name = "janei")
diabLL <- copy(diabLg)
## omkode all som svarte Ja til diabetes Type til 1
diabLL[.(janei = "Ja", diabType = diabetesVar, to = 1L),
on = c("janei", "diabType"), diab := i.to]
## Konvertere til wide
diabWide <- dcast(data = diabLL,
formula = Pnr + hospID + hosKort ~ diabType, value.var = "diab")
### Sjekk
diabWide
diabWide[diabetes_Kir62 == 1, .(Pnr, hospID, hosKort, diabetes_Kir62)]
## bytt NA til 0
for (j in diabetesVar){
set(diabWide, which(is.na(diabWide[[j]])), j, value = 0L)
}
## Summere for å finne missing for alt diabetes type
diabWide[, hvem := rowSums(.SD), .SDcols = diabetesVar ]
diabWide[, .N, by = hvem]
## som har ingen type diabetes
## ----------------------------
diaN <- diabWide[hvem == 0, .(Pnr)][[1]]
diaNoN <- list()
for (j in diaN){
nv <- paste0("a", j) #må hav valid navn og ikke bare tall
dd <- dt[Pnr == j, c("Pnr", "hospID", "hosKort", diabetesVar), with = F]
diaNoN[[nv]] <- dd
}
diaNoNperson <- rbindlist(diaNoN)
diaNoNperson
diaNoNperson[, .(Pnr, hospID, hosKort, diabetes_Kir62)]
vetIkkeDiab <- diaNoNperson[[1]]
## Siv Janne har kontrollet og disse er resultat som må rettes i datasettet
vetdt1 <- vetIkkeDiab[c(1:2, 4:5, 8:12)] #DT1
vetMody <- vetIkkeDiab[6] #Mody
diaNoDiag <- copy(diaNoNperson)
diaNoDiag[Pnr %in% vetdt1, diabetes_Type1 := "Ja"] #DT1
diaNoDiag[Pnr == vetMody, diabetes_Mody := "Ja"]
diaNoDiag
## replace main datasets value with the corrected values
diabVar.i <- paste0("i.", diabetesVar)
dt[diaNoDiag, (diabetesVar) := mget(diabVar.i), on = "Pnr"]
## pasienter med to type diabetes
## -----------------------------
dia2 <- diabWide[hvem == 2, .(Pnr)][[1]]
dia2DT <- list()
for (j in dia2){
nv <- paste0("a", j) #må hav valid navn og ikke bare tall
dd <- dt[Pnr == j, c("Pnr", "hospID", "hosKort", diabetesVar), with = F]
dia2DT[[nv]] <- dd
}
dia2DTperson <- rbindlist(dia2DT)
dia2DTperson
diabVar1 = c("diabetes_Type2", "diabetes_Mody", "diabetes_Kir62", "diabetes_SekDiabetes", "diabetes_AnnenDiabetes", "diabetes_UkjentDiabetes")
dia2DTperson[diabetes_Type1 == "Ja", (diabVar1) := NA]
## personer med flere diagnoser
dt1person <- dia2DTperson[, Pnr]
dt1person
## De som har DT1 og annen type blir bare med DT1.
perdt1 <- dt1person[-c(1:2)] #DT1
perkir <- dt1person[2] #kir62
perann <- dt1person[1] #annen
## Tømme alle verdie for de med minst to så legge tilbake det riktige etter at
## Siv Janne har kontorllert
dia2diag <- copy(dia2DTperson)
dia2diag[, (diabetesVar) := NA]
dia2diag[Pnr %in% perdt1, diabetes_Type1 := "Ja"] #DT1
dia2diag[Pnr == perkir, diabetes_Kir62 := "Ja"] #Kira62
dia2diag[Pnr == perann, diabetes_AnnenDiabetes := "Ja"] #Annen
dia2diag
## bytte verdi i hoved datasettet med korrigert verdi
dt[dia2diag, (diabetesVar) := mget(diabVar.i), on = "Pnr"]
Save Datasett
Lager bearbeidet datasettet for validering. Datasettet inneholder alle nye lagde variablene som brukes til å gjøre validering og senere skal brukes i analysen bl.a
- hospital : Sykehus
- dob : Fødselsdato i dato format
- alder : Alder for pasienter
- diagVar : Diabetes varighet
- alderArc : Alder ved menarche
- diagAlder : Alder ved diagnose
- diagDato : Diagnose dato for årskontroll siden inn_Diagdato finnes bare i førstegangsregistrering
- pump_txt : Omkodet beh_ins_pumpe_annet som er fritekst til et standardiserte liste etter at Siv Janne har gått gjennom listen.
saveRDS(dt, "validert_arskontroll2018.rds")
dt <- readRDS("validert_arskontroll2018.rds")
Excel per sykehus
Lager Excel fil per Sykehus
## lage tom dataset hvis NULL
nullDT <- function(x){
nullNames <- names(x[lengths(x)!=0][[1]]) #får colnames
missCol <- data.table(matrix(ncol = length(nullNames), nrow = 0)) #lage tom data.table
data.table::setnames(missCol, names(missCol), nullNames) #gir tom data.table riktig colnames
ikkeMis <- which(lengths(x)!=0) #index som ikke er NULL
# nullInd <- which(lengths(x)==0) #find index with NULL
sykInd <- hosDT$hospID
missInd <- which(!(sykInd %in% ikkeMis))
for (i in missInd){
x[[i]] <- missCol
}
return(x)
}
setkey(hosDT, hospID)
## Lage Excel per sykehus
for (i in hosDT$hospID) {
# liste over CHK variabelene
var1 <- nullDT(chk_hba1c)[[i]]
var2 <- nullDT(chk_Nasj)[[i]]
var3 <- nullDT(chk_diabtype)[[i]]
var4 <- nullDT(chk_bmi_under12)[[i]]
var5 <- nullDT(chk_bmi_over35)[[i]]
var6 <- nullDT(chk_diet)[[i]]
var7 <- nullDT(chk_alder19)[[i]]
var8 <- nullDT(chk_varihet0)[[i]]
var9 <- nullDT(chk_menarch9)[[i]]
var10 <- nullDT(chk_menarch16)[[i]]
var11 <- nullDT(chk_diagAlder0)[[i]]
var12 <- nullDT(chk_blodtrykk)[[i]]
var13 <- nullDT(chk_LDL26)[[i]]
var14 <- nullDT(chk_multi)[[i]]
var15 <- nullDT(chk_pumpe)[[i]]
var16 <- nullDT(chk_injek)[[i]]
var17 <- nullDT(chk_bolusdos)[[i]]
var18 <- nullDT(chk_nalskift)[[i]]
var19 <- nullDT(chk_urinprove)[[i]]
var20 <- nullDT(chk_mgmol)[[i]]
var21 <- nullDT(chk_mgl)[[i]]
var22 <- nullDT(chk_permicro)[[i]]
var23 <- nullDT(chk_inssjokk)[[i]]
var24 <- nullDT(chk_foling)[[i]]
var25 <- nullDT(chk_laserJa)[[i]]
var26 <- nullDT(chk_retino)[[i]]
var27 <- nullDT(chk_perineuro)[[i]]
syk.list <- list("hba1c" = var1,
"nasjonalitet" = var2,
"diaType" = var3,
"bmi_under12" = var4,
"bmi_over35" = var5,
"diet" = var6,
"alder19" = var7,
"varighet" = var8,
"menarch9" = var9,
"menarch16" = var10,
"diagAlder0" = var11,
"blodtrykk" = var12,
"LDL26" = var13,
"multiinjekt2" = var14,
"pumpe2" = var15,
"injek_hurtig10" = var16,
"bolus_dose" = var17,
"naalskift" = var18,
"urin" = var19,
"urin_mg_mmol" = var20,
"urin_mgl" = var21,
"persist_micro" = var22,
"insulinsjokk" = var23,
"foling" = var24,
"laserJA" = var25,
"retinopati" = var26,
"perifer_neuro" = var27
)
sykehusNavn <- hosDT$hosKort[hosDT$hospID==i]
stil <- openxlsx::createStyle(border = "top", fgFill = "#42ebf4")
openxlsx::write.xlsx(syk.list, file.path("./datavask/per_sykehus", paste0(format(Sys.Date(), "%Y%m%d"), "_", sykehusNavn, ".xlsx"), fsep = '/'),
headerStyle = stil, borders = "rows", colWidths = "auto")
}
Excel test
Manuelt test
# var1 <- chk_hba1c[[1]]
# var2 <- chk_Nasj[[1]]
# var3 <- chk_diabtype[[1]]
# var4 <- chk_bmi_under12[[1]]
# var5 <- chk_bmi_over35[[1]]
# var6 <- chk_diet[[1]]
#
# ## tar bort alle NULL
# chk_diet[lengths(chk_diet) != 0]
#
# ## get colnames if missing
# nullNames <- names(chk_diet[lengths(chk_diet)!=0][[1]])
# missCol <- data.table(matrix(ncol = length(nullNames), nrow = 0))
# missCol
# data.table::setnames(missCol, names(missCol), nullNames)
#
#
# data.table::setcolorder(var1, person.var)
# var1
#
# syk.list <- list("hba1c" = var1,
# "nasjonalitet" = var2,
# "diaType" = var3,
# "bmi_under12" = var4,
# "bmi_over35" = var5,
# "diet" = var6)
#
# openxlsx::write.xlsx(syk.list, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "Akershus.xlsx", sep = "_"), fsep = '/'),
# asTable = TRUE, colWidths = "auto")
Prøver å løse ved bruk av funksjon.
## List over "CHECK" variabler
## ------------------------------
# chk_var <- grep("^chk_", ls(), value = TRUE)
# eval(as.name(chk_var[1]))
# chk_var <- c("chk_Nasj",
# "chk_hba1c",
# "chk_diabtype",
# "chk_diet",
# "chk_bmi_under12",
# "chk_bmi_over35")
#
#
# list_var <- list(chk_Nasj,
# chk_hba1c,
# chk_diabtype,
# chk_diet,
# chk_bmi_under12,
# chk_bmi_over35)
#
#
# tabNavn <- c("nasjonalitet",
# "hba1c",
# "diaType",
# "diet",
# "bmi_under12",
# "bmi_over35")
#
#
# names(list_var) <- paste("Varr", 1:length(list_var), sep = "")
# list2env(list_var, envir = .GlobalEnv)
#
#
# var.List <- list()
#
# for (f in seq_along(chk_var)){
#
# #gir object navn
# assign(x = paste(".var", f, sep = ""), value = chk_var[f])
# #
# # lhs <- paste("as.character(", tabNavn[f], ")", sep = "")
# # rhs <- paste("eval(as.name(get(paste('.var'", f, "sep = ''))))", sep = '')
# # lrhs <- paste(lhs, rhs, sep = "=")
# # var.List[[f]] <- eval(parse(text=lrhs))
#
# testVar <- as.name(get(paste(".var", f, sep = "")))
#
# var.List[[f]] <- paste(tabNavn[f], testVar, sep = "=")
#
# }
# list2env()
#
# x <- as.list(rnorm(10))
# x
# names(x) <- paste("aa", 1:length(x), sep = "")
# list2env(x, envir = .GlobalEnv)
Anonymisering
Tar bort identifisertbar variabler for anonymisering.
anonymVar <- c("FNr", "ENavn", "FNavn", "MNavn", "PostNr", "PostSted", "Adresse", "Addresse", "Pnr", "fnr")
dt <- readRDS("validert_arskontroll2018.rds")
dim(dt)
anonymDT <- dt[, (anonymVar) := NULL]
saveRDS(anonymDT, "annonym_dt2018.RDS")
Excel fil
Lager Excelfil for datasom brukes til analyse for årsrapport.
rio::export(dt, "./Excelfiler/arskontroll2018.xlsx")
---
title: "Data validering"
date: "`r format(Sys.time(), '%d %B %Y')`"
output: 
  html_notebook:
    # number_sections: true
    toc: true
    toc_float:
      collapsed: true
---

# Pakker
Laster opp de nødvendige pakkene til valideringsarbeid.

```{r results='hide'}
pkgs = c("data.table", "stringi", "validate", "ggplot2", "lubridate", "rio")
sapply(pkgs, library, character.only = TRUE)
```

# Data

Ferdig renset data fra filen **datavask2018.R**.

```{r}
rawdt = readRDS("arskontroll2018.rds")
setDT(rawdt)
```

Format `FDato` til `%d-%m-%Y` og lage variabel `dob` for fødselsdato med Dato format.

```{r}
rawdt[, str(FDato)]
rawdt[ ,`:=`(dob = FDato, FDato = format(FDato, "%d-%m-%Y"))]
rawdt[, str(dob)]
```

Sti til RDS filer for pasient lister for de utvalgte variabler for vasking

```{r}
sti.vask <- "./datavask/rds"
```

# Funksjoner

Flere funksjoner for å sjekke data og deretter lager Excel-fil det man ønsker. Filen som er laget ligger i sub-mappen `./datavask`.

## Missing verdi

Funksjon `naTest` for å sjekke missing verdi.

```{r}
naTest <- function(dt, var, file, save = FALSE, mvar = NULL){
  # 'mvar' er for tillegg variabel
  # 'var' for missing variabel som skal sjekkes
  # "file" for filnavn f.eks file.xlsx
  
  if (!is.null(mvar)) {
    var.list <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospital", var, mvar)
    } else {
    var.list <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospital", var)
    }
  
  dtMiss <- dt[is.na(get(var)), ..var.list]

  # dtMiss[, FDato := format(FDato, "%d-%m-%Y")][]
  setkey(dtMiss, hospital)
  
  if(save){
    openxlsx::write.xlsx(dtMiss, file.path("./datavask",
                                          paste(format(Sys.Date(), "%Y%m%d"), file, sep = "_"), 
                                          fsep = '/'), 
                         asTable = TRUE, colWidths = "auto")
  }
  
  return(dtMiss)
}

```

## Lager sykehus ID

Lager alternativ ID til å bruke i *loop*.

```{r}
listHosp <- unique(rawdt$hospital)
hosDT <- data.table(hospital = sort(listHosp), hospID = 1:length(listHosp))

setkey(hosDT, hospID)
# saveRDS(hosDT, "hospitalID.rds")
# hosDT <- readRDS("hospitalID.rds")
hosDT
hosNavnKort <- c("Akershus", "Forde", "Haugesund", "Haukeland", "Sandessjoen", "Finnmark",
             "Kristiansund", "Molde", "Namsos", "Bodo", "Trondheim",
             "Stavanger", "Vestfold", "Gjovik", "Lillehammer", "Elverum", "Levanger",
             "Telemark",
             "Ostfold",
             "Arendal",
             "Kristiansand",
             "Ulleval",
             "Nord_norge",
             "Harstad",
             "Drammen",
             "Alesund")

# hosDT[, kortID := hospID]
# hosDT[.(kortID = 1:26, to = hosNavnKort), on = "kortID", hosKort := i.to]
hosDT[.(hospID = 1:26, to = hosNavnKort), on = "hospID", hosKort := i.to]

```

Merge `hospID` i datasettet

```{r}
setkey(hosDT, hospital)
setkey(rawdt, hospital)
dt <- hosDT[rawdt, on = "hospital"]
setkey(dt, hospID)
```

## Objekt per sykehus

Lage objekt for hvert sykehus som en *LIST*.

```{r}
# hospList <- unique(dt$hospital)
hospObj <- function(x){
  listHos <- unique(x$hospID)
  
  hospLIST = list() 
  
  for (i in listHos) {
    hospLIST[[i]] <- x[hospID == i, ]
  }
  
  return(hospLIST)
}

```

## Sjekk verdi

For å sjekke at verdi skal være et vist nivå.

```{r}
chkVerdi <- function(x, var, verdi, over = TRUE, mvar = NULL, all = FALSE){

  # var : valgte variabel som skal sjekkes
  # over : skal verdien over eller under
  # mvar : tillegg variabler som skal inkluderes i output
  # all : er det bare de med T1D eller alle i datasettet
  
  # standard variabler å ha
  if (is.null(mvar)){
    std.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", var)
  } else {
    std.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", var, mvar)
  }

  if (all == FALSE) {
    xt <-  x[diabetes_Type1 == "Ja", ]
  } else {
    xt = x 
  }
  
  if (over == TRUE){
  .chkdt <- xt[get(var) > verdi, ..std.var]
  } else {
  .chkdt <- xt[get(var) < verdi, ..std.var]
  }
  
  return(.chkdt)
}
```


## Person variabler

Lager objekt som inneholder alle person variabler

```{r}
person.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital")
```


# Nasjonalitet

Viser nasjonalitet.

```{r}
list.var <- c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", "Nasjonalitet", "nasMor", "nasFar")
dtNasj <- dt[is.na(Nasjonalitet), list.var, with = FALSE]
setkey(dtNasj, hospID)
dim(dtNasj)

# openxlsx::write.xlsx(dtNasj, file.path("./datavask",
#                                         paste(format(Sys.Date(), "%Y%m%d"), "Nasjonalitet.xlsx", sep = "_"), 
#                                         fsep = '/'), 
#                      asTable = TRUE, colWidths = "auto")
```


## Retting

Koblet fra Excel fil med lister over missing nasjonalitet som Siv Janne har rettet.

```{r}
xlNasj <- rio::import("./datavask/arkiv/20190507_Nasjonalitet.xlsx")
names(xlNasj)
str(xlNasj)
setDT(xlNasj)
setkey(xlNasj, Pnr)
dim(xlNasj)
xlNasj[is.na(Nasjonalitet), .N]
```

## Koblet xlsx

Koblet filen Siv Janne rettet med utrekk fra eReg.

```{r}
dtNasj2 <- xlNasj[dtNasj, on = c(Pnr = "Pnr")]
dim(dtNasj2)
names(dtNasj2)

# beholder variabler fra Excel som ble utfylt av Siv Janne
i.navn <- grep("^i.*", names(dtNasj2), value = T)
dtNasj2[, (i.navn) := NULL]
names(dtNasj2)
dtNasj2[is.na(Nasjonalitet), .N]

```


## Koble fil med den grønne databasen

Koble direkte til Access DB, men fikk ikke til å fungere.

```{r eval=FALSE}
grennDB <- odbcDriverConnect("Driver={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=K:\\Sensitivt\\Forskning02\\Barnediabetesregisteret_2015-5739\\Nyoppdaget diabetes\\Nyoppdaget_Type_1_diabetes_kopi.mdb")
```


Den grønne databasen som excelfil

```{r}
greenPath <- "K:\\Sensitivt\\Forskning02\\Barnediabetesregisteret_2015-5739\\Barnediabetes og kvalitet\\Datafiler\\accessfil" 

greenDT <- rio::import(file.path(greenPath, "20190507_greendb.xlsx", fsep = "\\"))
data.table::setDT(greenDT)
fdt <- grep("selsdato", names(greenDT), value = T)
greenDT[, Pnr := as.numeric(sprintf("%s%s", format(get(fdt), "%d%m%y"), Personnr))]
names(greenDT)
setkey(greenDT, Pnr)
greenSelect <- greenDT[, .(Pnr, Personnr, Fornavn, Etternavn, Etnisk_bakgr_pas, Etnisk_bakgr_mor, Etnisk_bakgr_far)]

```

Koble missing nasjonalitet med *Grønn Access* hvis de finnes info om nasjonalitet der.

```{r}
names(dtNasj2)
setkey(dtNasj2, Pnr)

db2db <- greenSelect[dtNasj2, on = c(Pnr = "Pnr")]
db2db[!is.na(Etnisk_bakgr_pas), .N]

```

Koble info om nasjonalitet fra den grønne

```{r}
db2db[is.na(Nasjonalitet), .N]
db2db[is.na(Nasjonalitet), Nasjonalitet := Etnisk_bakgr_pas] # Nasjonalitet
db2db[is.na(nasMor), nasMor := Etnisk_bakgr_mor] # Nasj. mor
db2db[is.na(nasFar), nasFar := Etnisk_bakgr_far] # Nasj. far
```

Beholder bare variable som kommer fra eReg

```{r}
dtNasj3 <- db2db[ , ..list.var]
dtNasj3[, FDato := format(FDato, "%d-%m-%Y")]
dim(dtNasj3)
dtNasj3[is.na(Nasjonalitet), .N]

```

Lager renset missing Nasjonalitet og koblet med grønn datasettet.

```{r, eval=F}
saveRDS(dtNasj3, "./datavask/renset/nasjonalitet.rds")
# dtNasj3 <- readRDS("./datavask/renset/nasjonalitet.rds")
```

Merge tilgengelige nasjonalitet fra grønn datasettet og halv bearbeid Excel fra Siv Janne til hele datasettet.

```{r}
names(dtNasj3)
kob_nasj <- dtNasj3[, .(Pnr, Nasjonalitet, nasMor, nasFar)] #velger relevant variabler for nasjonlitet

# Dtt <- copy(dt)

dt[dtNasj3, Nasjonalitet := ifelse(is.na(Nasjonalitet), i.Nasjonalitet, Nasjonalitet), on = "Pnr"] #erstater missing Nasjonalitet
# Dtt[is.na(Nasjonalitet), Nasjonalitet := dtNasj3[.SD, Nasjonalitet, on = "Pnr"]]

dt[dtNasj3, nasMor := ifelse(is.na(nasMor), i.nasMor, nasMor), on = "Pnr"] #erstater missing nasMor
dt[dtNasj3, nasFar := ifelse(is.na(nasFar), i.nasFar, nasFar), on = "Pnr"] #erstater missing nasFar
```


Liste pasienter som fortsatt mangler info for Nasjonalitet per sykehus

```{r}
dtNasj4 <- dtNasj3[is.na(Nasjonalitet), ] 
chk_Nasj <- hospObj(dtNasj4)

saveRDS(chk_Nasj, file.path(sti.vask, "chk_Nasj.rds"))
```


# HbA1c

Variabelnavn `lab_HbA1cAkerVerdi`. Sjekk antall missing, HbA1c < 4 og > 15.

```{r}
# hba1c = validator(.file = 'hba1c.yaml')
v_hba <- validator(
   lab_HbA1cAkerVerdi > 4
   , lab_HbA1cAkerVerdi < 15
   , !is.na(lab_HbA1cAkerVerdi)
)

c_hba <- confront(dt, v_hba, key = "Pnr")
summary(c_hba)
# dthba <- as.data.frame(c_hba)
# setDT(dthba)
# dthba[, .N, by=list(expression, value)]

# dtt = aggregate(c_hba, by='record')
# setDT(dtt)
# dtt$
# dtt[rel.fail==1, ]
```
```{r eval=FALSE}
barplot(c_hba, main = "HbA1c verdi")
```

Lager Excel fil for missing verdi HbA1c.

```{r results='hide'}
NA_hba1c = naTest(dt, "lab_HbA1cAkerVerdi", paste(format(Sys.Date(), "%Y%m%d"), "hba1c.xlsx", sep="_"), save = FALSE, mvar = "hospID")
```

Liste pasienter med missing **HbA1c** per sykehus

```{r}
chk_hba1c <- hospObj(NA_hba1c)

saveRDS(chk_hba1c, file.path(sti.vask, "chk_hba1c.rds"))
```


# Diabetes Type

## Missing diabetes Type

Sjekk missing diabetes type inkludert insulinbehandling. Hvis det er Type 1 så må det være en av de insulinbehandlingene svart *JA*.


```{r}
DTtype <- dt[is.na(diabetes_Type1) & is.na(diabetes_Type2) & is.na(diabetes_Mody) & is.na(diabetes_AnnenDiabetes), 
             c(person.var, 
               "diabetes_Type1",
               "diabetes_Type2",
               "diabetes_Mody",
               "diabetes_AnnenDiabetes",
               "beh_ferdig_bland",
               "beh_ins_beh",
               "beh_ins_pumpe"), with=FALSE]

DTtype
setkey(DTtype, hospID)

chk_diabtype <- hospObj(DTtype)

saveRDS(chk_diabtype, file.path(sti.vask, "chk_diabtype.rds"))

# openxlsx::write.xlsx(DTtype, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "diabetesType.xlsx", sep = "_"), fsep = '/'), 
#                      asTable = TRUE, colWidths = "auto")
```


### Diet og diabetes Type 1

Hvis det er diett så kan det ikke være diabetes Type 1.


```{r}
dt[beh_diett == "Ja", .N, by=.(diabetes_Type1)]
diet1 <- dt[diabetes_Type1 == "Ja" & beh_diett == "Ja", c(person.var, "diabetes_Type1", "beh_anti_tab", "beh_diett"), with=F]
diet1
```

Hvis bruker antidiabetes tabeletter kan ikke være diabetes Type 1.


```{r}
dt[beh_anti_tab == "Ja", .N, by=.(diabetes_Type1)]
diet2 <- dt[diabetes_Type1 == "Ja" & beh_anti_tab == "Ja", c(person.var, "diabetes_Type1", "beh_anti_tab", "beh_diett"), with=F]
diet2
```


Koble de to sammen


```{r}
diet22 <- diet2[!diet1, on="Pnr"] #ekluderer den som finnes på begge
diet22

diet12 <- rbindlist(list(diet1, diet22))
```


Lager liste


```{r}
chk_diet <- hospObj(diet12)

saveRDS(chk_diet, file.path(sti.vask, "chk_diet.rds"))
```


# Vekt og høyde

Kontrollerer at **Høyde** under 2 meter og **Vekt** under 100 kg. Variabel `BMI` lages med formel: $$\frac{Vekt(kg)}{Høyde(m)^2}$$

Lager __BMI_ variabel.

```{r}
## BMI
dt[!is.na(inn_Vekt) & !is.na(inn_Lengde), bmi := (inn_Vekt/inn_Lengde/inn_Lengde)*10000]

```

Sjekk antall for unvanlige tall bl.a høyde, vekt og bmi.

```{r}

## validering
v_kg = validator(
  inn_Lengde > 10,
  inn_Lengde < 200,
  inn_Vekt > 20,
  inn_Vekt < 100,
  BMI := (inn_Vekt/inn_Lengde/inn_Lengde)*10000,
  BMI < 30,
  BMI < 35,
  BMI > 11
  )

con_kg = confront(dt, v_kg, key="Pnr")
# con_kg
summary(con_kg)
```

```{r eval=FALSE}
barplot(con_kg, main = "Vekt, Høyde og BMI")
```

Høyde under 10 cm

```{r}
dt[inn_Lengde < 10, person.var, with=F]
```


BMI under 11

```{r}
bmi_pas.list=c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospID", "hospital", "inn_Lengde", "inn_Vekt")
pasBMI_11 <- dt[bmi < 12, ..bmi_pas.list]
setkey(pasBMI_11, hospID)
dim(pasBMI_11)

chk_bmi_under12 <- hospObj(pasBMI_11)

saveRDS(chk_bmi_under12, file.path(sti.vask, "chk_bmi_under12.rds"))

# 
# openxlsx::write.xlsx(pasBMI, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), 
#                                                               "bmi_under11.xlsx", sep = "_"), fsep = '/'), 
#                      asTable = TRUE, colWidths = "auto")

```


BMI over 35


```{r}
pasBMI35 <- dt[bmi > 35, ..bmi_pas.list]
dim(pasBMI35)
chk_bmi_over35 <- hospObj(pasBMI35)

saveRDS(chk_bmi_over35, file.path(sti.vask, "chk_bmi_over35.rds"))
```

# Alder

Sjekk minimum alder under 0 og maksimum over 18 år. Variabel `alder` må lages først.


```{r results='hide'}
dt[, alder := as.numeric(round(as.period(interval(dob, inn_Dato)/duration(n=1, unit="years")), digits = 1))]
```

Validerings data

```{r}
v_age <- validator(
  alder > 0,
  alder < 19
)

c_age <- confront(dt, v_age, key="Pnr")
```

```{r}
summary(c_age)
```

Plotting valideringsdata

```{r eval=FALSE}
barplot(c_age, main = "Alder under 0 og over 18 år")
```

Liste av pasienter over 19 år per sykehus.

```{r}
alder19 <- dt[alder > 18.999, c(person.var, "inn_Dato", "alder"), with=F]
dim(alder19)
chk_alder19 <- hospObj(alder19)

saveRDS(chk_alder19, file.path(sti.vask, "chk_alder19.rds"))
```

# Diabetesvarighet

Diabetesvarighet definert som lengde fra diagnose dato `inn_DiagDato` til kontroll tidspunktet `inn_Dato`. Ny variabel lages for diabetesvarighet som heter `diagVar`.

```{r}
dt[, diagVar := as.numeric(round(as.period(interval(diagDato, inn_Dato)/duration(n=1, unit="years")), digits = 1))]
```

Sjekk for diabetesvarighet under 0 år.

```{r}
c_diagv <- check_that(dt, diagVar > 0)
summary(c_diagv)
```

```{r eval=FALSE}
validate::aggregate(c_diagv)
head(aggregate(c_diagv, by='record')) #see hvilken linje som har feil
sort(c_diagv) # se hvilken verdi som gjør feilen
```


List av pasienter

```{r}
varighet0 <- dt[diagVar < 0.0007, c(person.var, "diagDato", "inn_Dato", "diagVar"), with=F]
dim(varighet0)
chk_varihet0 <- hospObj(varighet0)

saveRDS(chk_varihet0, file.path(sti.vask, "chk_varihet0.rds"))
```

# Menarche

Alder ved menarche. Sjekk for minimun alder av 9 år og maksimum av 16.5 år. Ny variabel `alderArc` lages. OBS! husk __dob__ brukes for fødselsdato siden __FDato__ er string.

```{r}
dt[!is.na(inn_MenarcheTidspunkt), 
   alderArc := as.numeric(round(as.period(interval(dob, inn_MenarcheTidspunkt)/duration(n=1, units = 'years')), 
                                digits = 1))]
```

Validering for `alderArc`.

```{r}
v_ageMrch <- validator(
  alderArc > 9,
  alderArc < 16.5
)

c_ageMrch <- confront(dt, v_ageMrch)
```

Tabell for antall som er under 9 år og over 16.5 år.

```{r}
summary(c_ageMrch)
```


Liste over pasienter med menarche under 9 år.

```{r results='hide'}
# menarVar =  c("PasientID", "Pnr", "FDato", "FNavn", "ENavn", "hospital", "inn_MenarcheTidspunkt", "alderArc")
menarch9 <- dt[alderArc < 9, c(person.var, "inn_MenarcheTidspunkt", "alderArc"), with=F]
setkey(menarch9, hospID)
# openxlsx::write.xlsx(menarch9, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "menarch_under9yrs.xlsx", sep = "_"), fsep = '/'), 
                     # asTable = TRUE, colWidths = "auto")

dim(menarch9)
chk_menarch9 <- hospObj(menarch9)

saveRDS(chk_menarch9, file.path(sti.vask, "chk_menarch9.rds"))
```

Liste over pasienter med menarche over 16.5 år.

```{r results='hide'}
menarch16 <- dt[alderArc > 16.5,  c(person.var, "inn_MenarcheTidspunkt", "alderArc"), with=F]
setkey(menarch16, hospID)
dim(menarch16)
chk_menarch16 <- hospObj(menarch16)

saveRDS(chk_menarch16, file.path(sti.vask, "chk_menarch16.rds"))

# openxlsx::write.xlsx(menarch16, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "menarch_over165yrs.xlsx", sep = "_"), fsep = '/'), 
#                      asTable = TRUE, colWidths = "auto")

```


# Diagnose Alder

Diagnose alder min 0 og max 18 år. Først lage variabel __diagAlder__.

```{r}
dt[, diagAlder := as.numeric(round(as.period(interval(dob, diagDato)/duration(n=1, units = 'years')), digits = 1))]
```

```{r}
v_alderDiag <- validator(
  diagAlder > 0,
  diagAlder < 18
)

c_alderDiag <- confront(dt, v_alderDiag)
sort(c_alderDiag) # se på verdier for å være feil
summary(c_alderDiag)
```

List over pasienter for diagnose alder som ikke møter forventingene. Diagnose alder under 1 år.

```{r}
diagAlder0 <- dt[diagAlder < 0.9, c(person.var, "diagDato", "diagAlder", "diabetes_Type1"), with=F]
dim(diagAlder0)
setkey(diagAlder0, hospID)

chk_diagAlder0 <- hospObj(diagAlder0)

saveRDS(chk_diagAlder0, file.path(sti.vask, "chk_diagAlder0.rds"))
```

# Blodtrykk

Systolisk skal ikke være over 140 og diastolisk skal ikke være under 45

```{r}
v_blodtrykk <- validator(
  inn_Blodtrykk_s < 140,
  inn_Blodtrykk_d > 45
)

c_blodtrykk <- confront(dt, v_blodtrykk)
summary(c_blodtrykk)
```

Lister over pasienter som ikke møter kravet.

```{r}
blodtrk_s <- dt[inn_Blodtrykk_s > 140, c(person.var, "inn_Blodtrykk_s", "inn_Blodtrykk_d"), with=F]
blodtrk_d <- dt[inn_Blodtrykk_d < 45, c(person.var, "inn_Blodtrykk_s", "inn_Blodtrykk_d"), with=F]

blodtrk <- rbindlist(list(blodtrk_d, blodtrk_s), use.names = TRUE)

setkey(blodtrk, hospID)

chk_blodtrykk <- hospObj(blodtrk)

saveRDS(chk_blodtrykk, file.path(sti.vask, "chk_blodtrykk.rds"))

```


# LDL

Liste over alle LDL som er `>=2.6`. Bruk LDL ikke fastende `lab_lip_LDL_2`, men hvis missing fastende LDL skal brukes hvis det finnes `lab_lip_LDL`.

Lager variabel __ldl3__ for ikke fastende LDL og legger til fastende hvis missing.

```{r}
dt[, lapply(.SD, str), .SDcols = c("lab_lip_LDL_2", "lab_lip_LDL")]

dt[ , ldl3 := lab_lip_LDL_2][is.na(lab_lip_LDL_2), ldl3 := lab_lip_LDL]
dt[is.na(lab_lip_LDL_2), .N]
dt[is.na(ldl3), .N]

```

Sjekk antall som er over og lik 2.6.

```{r}
v_ldl <- validator(
  ldl3 <= 2.6,
  ldl3 < 2.7
)

c_ldl <- confront(dt, v_ldl)
sort(c_ldl)
summary(c_ldl)

```

Liste pasienter

```{r}
ldl26 <- dt[ldl3 >=2.6, c(person.var, "lab_lip_LDL_2", "lab_lip_LDL"), with=F]
dim(ldl26)

setkey(ldl26, hospID)

chk_LDL26 <- hospObj(ldl26)
saveRDS(chk_LDL26, file.path(sti.vask, "chk_LDL26.rds"))
```

# Behandling

Forskjellige variabler for behandling av diabetes. Gjelder bare for T1D.

## Multiinjuksjon

Gjelder bare for pasienter med T1D. Superhurtigvirkende `beh_ins_beh_hurtig_ie_dogn` plus langtidsvirkende `beh_ins_beh_lang_ie_dogn` del med kroppsvekt `inn_Vekt`. Normal verdi skal være < 2.


```{r eval=FALSE}
dt[, str(.SD), .SDcols = c("beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn", "inn_Vekt")]
# dt[, lapply(.SD, str), .SDcols = c("beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn")]
```

Endre NA i begge variablene til 0. Lager variabel __multinj__ for summan av superhurtigvirkende og langtidsvirkende behandling og del med kroppsvekt.

```{r}
dt[ , beh_hurtigNA0 := beh_ins_beh_hurtig_ie_dogn][is.na(beh_hurtigNA0), beh_hurtigNA0 := 0] 
dt[ , beh_langtidNA0 := beh_ins_beh_lang_ie_dogn][is.na(beh_langtidNA0), beh_langtidNA0 := 0]
dt[, multinj := round((beh_hurtigNA0 + beh_langtidNA0)/inn_Vekt, digits = 2)]

dt[, .(beh_ins_beh_hurtig_ie_dogn, beh_ins_beh_lang_ie_dogn, inn_Vekt, multinj)]

```

Liste pasienter. Gjelder bare pasienter med T1D.

```{r}
beh_multi <- dt[diabetes_Type1=="Ja" & multinj > 2, c(person.var, "beh_ins_beh_hurtig_ie_dogn", "beh_ins_beh_lang_ie_dogn", "inn_Vekt"), with=F]
dim(beh_multi)

setkey(beh_multi, hospID)

chk_multi <- hospObj(beh_multi)
saveRDS(chk_multi, file.path(sti.vask, "chk_multi.rds"))
```

## Insulinpumpe

Normal verdig skal ikke være < 2

```{r}
dt[, str(.SD), .SDcols = c("beh_ins_type_ie_basal", "beh_ins_type_ie_bolus", "inn_Vekt")]
```

Endre NA i begge variablene til 0. Lager variabel __pumpe__ for summan av superhurtigvirkende og langtidsvirkende behandling og del med kroppsvekt.

```{r}
dt[ , beh_basalNA0 := beh_ins_type_ie_basal][is.na(beh_basalNA0), beh_basalNA0 := 0] 
dt[ , beh_bolusNA0 := beh_ins_type_ie_bolus][is.na(beh_bolusNA0), beh_bolusNA0 := 0]
dt[, pumpe := round((beh_basalNA0 + beh_bolusNA0)/inn_Vekt, digits = 2)]

dt[, .(beh_ins_type_ie_basal, beh_ins_type_ie_bolus, inn_Vekt, pumpe)]

```

Lister av pasienter med T1D

```{r}
beh_pumpe <- dt[diabetes_Type1 == "Ja" & pumpe > 2, c(person.var,"beh_ins_type_ie_basal", "beh_ins_type_ie_bolus", "inn_Vekt"), with=F]
dim(beh_pumpe)

chk_pumpe <- hospObj(beh_pumpe)
saveRDS(chk_pumpe, file.path(sti.vask, "chk_pumpe.rds"))
```

## Pumpe annet

Variabelnavn `beh_ins_pumpe_annet` er en fritekst. De må standardiseres.

```{r}
pumpsti = "./datavask"

pumpny <- read.csv2(file.path(pumpsti, "pumpe.csv"))
setDT(pumpny)

pumpeDT <- subset(pumpny, select = 1:2)
library(stringi)
pumpeDT[, pumpe_all := stri_replace_all_fixed(pumpe_ny, "?", "")]

pumpeDT
pumpeOld <- pumpeDT[["beh_ins_pumpe_annet"]]
pumpeNy <- pumpeDT[["pumpe_all"]]

```

Merge de nye standardiserte navnene til hele datasettet.

```{r}
dt[.(beh_ins_pumpe_annet = pumpeOld, to = pumpeNy), on = "beh_ins_pumpe_annet", pumpe_txt := i.to ]

```


## Injeksjoner hurtigvirk

Antall injeksjoner hurtigvirkende insulin per døgn. Den skal ikke være mer en 10

```{r eval=FALSE}
str(dt$beh_ins_beh_hurtig_inj_dogn)
```

Liste over pasienter med verdi over 10.

```{r}
injek.dt <- chkVerdi(dt, "beh_ins_beh_hurtig_inj_dogn", verdi = 10)
dim(injek.dt)

chk_injek <- hospObj(injek.dt)
saveRDS(chk_injek, file.path(sti.vask, "chk_injek.rds"))
```

## Injeksjoner langtidvirk

Antall injeksjoner langtidsvirkende insulin per døgn. Den skal ikke være mer enn 2

```{r eval=FALSE}
str(dt$beh_ins_beh_lang_ie_dogn)
```

Liste over pasienter

```{r}
injek.lang <- chkVerdi(dt, "beh_ins_beh_lang_inj_dogn", verdi = 2)
dim(injek.lang)
```

## Bolusdoser

Antall bolusdoser per døgn. Den skal ikke være mer enn 12.

```{r eval=FALSE}
str(dt$beh_ins_tot_enh_dogn_bolus)
```


```{r}
bolusdos <- chkVerdi(dt, "beh_ins_tot_enh_dogn_bolus", verdi = 12)
dim(bolusdos)

chk_bolusdos <- hospObj(bolusdos)
saveRDS(chk_bolusdos, file.path(sti.vask, "chk_bolusdos.rds"))
```

## Nålskifte

Antall nålskifte. Skal ikke være mer enn 5

```{r eval=FALSE}
str(dt$beh_ins_nal_skift_dogn)
```

Liste over pasienter

```{r}
nalskift <- chkVerdi(dt, "beh_ins_nal_skift_dogn", verdi = 5)
dim(nalskift)

setkey(nalskift, hospID)
chk_nalskift <- hospObj(nalskift)
saveRDS(chk_nalskift, file.path(sti.vask, "chk_nalskift.rds"))
```

# Albuminundersøkelse

## Urin prøve missing

Sjekk for mangler eller missing for urinprøve `lab_res_1prove`. Hvis missing skal det sjekkes om de er riktig missing ved å se at det ble besvart
NEI for `lab_urinprove` eller at det var skrevet årsak i `lab_urinprove_hvorfor`.

```{r eval=FALSE}
dt[, str(.SD), .SDcols = c("lab_res_1prove", "lab_urinprove", "lab_urinprove_hvorfor")]
```

Pasient lister

```{r}
urinprov <- dt[is.na(lab_res_1prove), ][!is.na(lab_urinprove_hvorfor) | lab_urinprove == TRUE, c(person.var, "lab_res_1prove"), with=F]
dim(urinprov)
```

```{r}
setkey(urinprov, hospID)
chk_urinprove <- hospObj(urinprov)
saveRDS(chk_urinprove, file.path(sti.vask, "chk_urinprove.rds"))
```

## Albumin/kreatinin

Henter kategoriske variabelnavn `lab_res_1menhet` siden den ikke er kodet i tall.

```{r}
mgmol <- grep("^mg/mmol", dt$lab_res_1menhet, value = T)[1]
mgl <- grep("^mg/l", dt$lab_res_1menhet, value = T)[1]
```

### mg/mmol

Hvis (lab_res_1menhet) = 2 (mg/mmol) skal (lab_res_1prove) skal det IKKE være >=2.5.

```{r}
mgmol.dt <- dt[lab_res_1menhet == mgmol, ]

mgmol.sub <- chkVerdi(mgmol.dt, var = "lab_res_1prove", verdi = 2.4999)
dim(mgmol.sub)

chk_mgmol <- hospObj(mgmol.sub)
saveRDS(chk_mgmol, file.path(sti.vask, "chk_mgmol.rds"))
```


### mg/l

Hvis (lab_res_1menhet) = 1 (mg/l) skal (lab_res_1prove) skal det IKKE være >=30

```{r}
mgl.dt <- dt[lab_res_1menhet == mgl, ]

mgl.sub <- chkVerdi(mgl.dt, var = "lab_res_1prove", verdi = 29.9999)
dim(mgl.sub)

chk_mgl <- hospObj(mgl.sub)
saveRDS(chk_mgl, file.path(sti.vask, "chk_mgl.rds"))
```

### mikrog/min

Hvis (lab_res_1menhet) = 3 (mikrog/min) skal (lab_res_1prove) skal det IKKE være >=20

```{r}
dt[, .N, by=.(lab_res_1menhet)]
```

Ikke gjort fordi ingen har den verdien.

# Persisterende microalbumniuri

Hvis svar til variabel `lab_res_persmikro` er JA, tar ut liste av pasienter.

```{r}
permicro <- dt[lab_res_persmikro == "Ja", c(person.var, "lab_res_persmikro"), with=F]
dim(permicro)

chk_permicro <- hospObj(permicro)
saveRDS(chk_permicro, file.path(sti.vask, "chk_permicro.rds"))

```


# Insulinsjokk

Sjekk at `und_inssjokk_ant` er IKKE mer enn 8

```{r eval=FALSE}
str(dt$und_inssjokk_ant)
dt[und_inssjokk_ant > 8, .(und_inssjokk_ant, hospital)]
```

```{r}
ins_sjokk <- chkVerdi(dt, "und_inssjokk_ant", verdi = 8)
dim(ins_sjokk)

chk_inssjokk <- hospObj(ins_sjokk)
saveRDS(chk_inssjokk, file.path(sti.vask, "chk_inssjokk.rds"))
```

# DKA

Sjekk at `und_ketoacidose_ant` er IKKE mer en 5

```{r eval=FALSE}
str(dt$und_ketoacidose_ant)
```

Liste av pasienter

```{r}
ketdose <- chkVerdi(dt, "und_ketoacidose_ant", verdi = 5)
dim(ketdose)

chk_dka <- hospObj(ketdose)
chk_dka
```

# Følinger

Sjekk at `und_foling_ant` er IKKE mer enn 10

```{r eval=FALSE}
str(dt$und_foling_ant)
```

Liste over pasienter

```{r}
foling.dt <- chkVerdi(dt, "und_foling_ant", 10)
dim(foling.dt)

chk_foling <- hospObj(foling.dt)
saveRDS(chk_foling, file.path(sti.vask, "chk_foling.rds"))
```

# Undersøkelse

```{r eval=FALSE}
dt[, .N, by=.(und_laser)]
dt[, .N, by=.(und_Retinopati)]
dt[, .N, by=.(und_Retinopati_valg)]
dt[, .N, by=.(und_periferneu)]
```

## Laserbehandling

Liste for alle som svarte JA

```{r}
laserJa <- dt[und_laser == "Ja", c(person.var, "und_laser"), with=F]
dim(laserJa)

chk_laserJa <- hospObj(laserJa)
saveRDS(chk_laserJa, file.path(sti.vask, "chk_laserJa.rds"))
```

## Retinopati

Liste over alle som svarte Ja på `und_Retinopati` og har svart på `und_Retinopati_valg`

```{r}
retino1 <- dt[und_Retinopati == "Ja", c(person.var, "und_Retinopati", "und_Retinopati_valg"), with=F]
retino2 <- dt[!is.na(und_Retinopati_valg), c(person.var, "und_Retinopati", "und_Retinopati_valg"), with=F]

ret11 = retino1[!retino2, on = "Pnr"] #pasient som befinnes bare i retino1

retino12 <- rbindlist(list(ret11, retino2))
dim(retino12)

chk_retino <- hospObj(retino12)
saveRDS(chk_retino, file.path(sti.vask, "chk_retino.rds"))
```

## Perifer neuropati

Liste over alle som svarte JA

```{r}
dt[, .N, by=.(und_periferneu)]
```

Liste av pasienter

```{r}
perif.dt <- dt[und_periferneu == "Ja", c(person.var, "und_periferneu"), with=F]
dim(perif.dt)

chk_perineuro <- hospObj(perif.dt)
saveRDS(chk_perineuro, file.path(sti.vask, "chk_perineuro.rds"))
```

# Pasienter med flere årskontroll

Disse er pasienter som gjennomført årskontroll mer enn to ganger. Årskontroll skal bare telles en gang. Derfor skal det være KUN en årskontroll per pasient og sykehuset
må kontaktes for å bekrefte hvilket av dem skal beholdes.

```{r eval=FALSE}
dim(dt)
dt[duplicated(Pnr), .(Pnr)]
dt[PasientID == 7071, .(PasientID, Pnr, OppholdID,  hospital, FNavn, ENavn, diagDato, diabetes_Type1, inn_Dato, yr)]
```

sykehus i Vestfold har bekreftet at årskontroll som var tatt i 18.04.2018 er den gjeldene.

```{r eval=FALSE}
dt <- dt[OppholdID != 115449, ]
dim(dt)
```



# Pasienter  med ingen eller flere diagnoser

Noen pasienter har blitt registrert med flere diagnoser eller ingen. Hvem er disse?
Når liste av pasienter er laget så skal Siv Janne kontakter sykehusene for varifisering.

```{r dtype, eval=F}

## Demografisk variabler
demoVar <-  c("PasientID", "Pnr", "hospital", "hospID", "hosKort", "alder", "Kjonn", "diagVar", "diagAlder")

## diabetes variabler
diabetesVar = c("diabetes_Type1", "diabetes_Type2", "diabetes_Mody", "diabetes_Kir62", "diabetes_SekDiabetes", "diabetes_AnnenDiabetes", "diabetes_UkjentDiabetes")

## lage subset
diabDT <- dt[, c(demoVar, diabetesVar), with = F]

## trim whitespace
##-----------------------
for (j in diabetesVar){
  if(class(diabDT[[j]]) == 'character')
    set(diabDT, j = j, value = trimws(diabDT[[j]]))
}

## ## vanlig loop for whitespace deletion. OBS!! Treggere enn loop set
## for (j in diabetesVar){
##  diabDT[, (j) := trimws(get(j))]
## }


## Check whitespace er borte
diabDT[Pnr == 7090197481, .(diabetes_Kir62)][[1]]

## ## måtte gjøre det nesten manuelt siden trimws for alle kolonne i data.table ikke
## ## funker som det bør være
## diabDT[!is.na(diabetes_Kir62), diabetes_Kir62  := trimws(diabetes_Kir62)]

## Lage en long dataset
diabLg <- melt(data = diabDT,
  id.vars = demoVar,
  measure.vars = diabetesVar,
  variable.name = "diabType",
  value.name = "janei")

diabLL <- copy(diabLg)

## omkode all som svarte Ja til diabetes Type til 1
diabLL[.(janei = "Ja", diabType = diabetesVar, to = 1L),
  on = c("janei", "diabType"), diab := i.to]

## Konvertere til wide
diabWide <- dcast(data = diabLL,
  formula = Pnr + hospID + hosKort ~ diabType, value.var = "diab")

### Sjekk
diabWide
diabWide[diabetes_Kir62 == 1, .(Pnr, hospID, hosKort, diabetes_Kir62)]

## bytt NA til 0
for (j in diabetesVar){
  set(diabWide, which(is.na(diabWide[[j]])), j, value = 0L)
}


## Summere for å finne missing for alt diabetes type
diabWide[, hvem := rowSums(.SD), .SDcols = diabetesVar ]

diabWide[, .N, by = hvem]

## som har ingen type diabetes
## ----------------------------
diaN <- diabWide[hvem == 0, .(Pnr)][[1]]

diaNoN <- list()
for (j in diaN){
  nv <- paste0("a", j) #må hav valid navn og ikke bare tall
  dd <- dt[Pnr == j, c("Pnr", "hospID", "hosKort", diabetesVar), with = F]
  diaNoN[[nv]] <- dd
}

diaNoNperson <- rbindlist(diaNoN)
diaNoNperson
diaNoNperson[, .(Pnr, hospID, hosKort, diabetes_Kir62)]

vetIkkeDiab <- diaNoNperson[[1]]


## Siv Janne har kontrollet og disse er resultat som må rettes i datasettet
vetdt1 <- vetIkkeDiab[c(1:2, 4:5, 8:12)] #DT1
vetMody <- vetIkkeDiab[6] #Mody

diaNoDiag <- copy(diaNoNperson)
diaNoDiag[Pnr %in% vetdt1, diabetes_Type1 := "Ja"] #DT1
diaNoDiag[Pnr == vetMody, diabetes_Mody := "Ja"]
diaNoDiag

## replace main datasets value with the corrected values
diabVar.i <- paste0("i.", diabetesVar)
dt[diaNoDiag, (diabetesVar) := mget(diabVar.i), on = "Pnr"]

## pasienter med to type diabetes
## -----------------------------
dia2 <- diabWide[hvem == 2, .(Pnr)][[1]]

dia2DT <- list()
for (j in dia2){
  nv <- paste0("a", j) #må hav valid navn og ikke bare tall
  dd <- dt[Pnr == j, c("Pnr", "hospID", "hosKort", diabetesVar), with = F]
  dia2DT[[nv]] <- dd
}

dia2DTperson <- rbindlist(dia2DT)
dia2DTperson

diabVar1 = c("diabetes_Type2", "diabetes_Mody", "diabetes_Kir62", "diabetes_SekDiabetes", "diabetes_AnnenDiabetes", "diabetes_UkjentDiabetes")

dia2DTperson[diabetes_Type1 == "Ja", (diabVar1)  := NA]
## personer med flere diagnoser
dt1person <- dia2DTperson[, Pnr]
dt1person

## De som har DT1 og annen type blir bare med DT1.
perdt1 <- dt1person[-c(1:2)] #DT1
perkir <- dt1person[2] #kir62
perann <- dt1person[1] #annen

## Tømme alle verdie for de med minst to så legge tilbake det riktige etter at
## Siv Janne har kontorllert
dia2diag <- copy(dia2DTperson)
dia2diag[, (diabetesVar) := NA]
dia2diag[Pnr  %in% perdt1, diabetes_Type1 := "Ja"] #DT1
dia2diag[Pnr == perkir, diabetes_Kir62 := "Ja"] #Kira62
dia2diag[Pnr == perann, diabetes_AnnenDiabetes := "Ja"] #Annen
dia2diag

## bytte verdi i hoved datasettet med korrigert verdi
dt[dia2diag, (diabetesVar) := mget(diabVar.i), on = "Pnr"]

```

# Save Datasett

Lager bearbeidet datasettet for validering. Datasettet inneholder alle nye lagde variablene som brukes til å gjøre validering og senere skal brukes i analysen bl.a

- _hospital_     : Sykehus
- _dob_          : Fødselsdato i dato format
- _alder_        : Alder for pasienter
- _diagVar_      : Diabetes varighet
- _alderArc_     : Alder ved menarche
- _diagAlder_    : Alder ved diagnose
- _diagDato_     : Diagnose dato for årskontroll siden *inn_Diagdato* finnes bare i førstegangsregistrering
- _pump_txt_     : Omkodet *beh_ins_pumpe_annet* som er fritekst til et standardiserte liste etter at Siv Janne har gått gjennom listen.


```{r eval=FALSE}
saveRDS(dt, "validert_arskontroll2018.rds")
dt <- readRDS("validert_arskontroll2018.rds")
```

# Excel per sykehus

Lager Excel fil per Sykehus


```{r}
## lage tom dataset hvis NULL
nullDT <- function(x){
  nullNames <- names(x[lengths(x)!=0][[1]]) #får colnames
  missCol <- data.table(matrix(ncol = length(nullNames), nrow = 0)) #lage tom data.table
  data.table::setnames(missCol, names(missCol), nullNames) #gir tom data.table riktig colnames
  
  ikkeMis <- which(lengths(x)!=0) #index som ikke er NULL
  # nullInd <- which(lengths(x)==0) #find index with NULL
  
  sykInd <- hosDT$hospID
  missInd <- which(!(sykInd %in% ikkeMis))
  
  for (i in missInd){
    x[[i]] <- missCol
  }
  
  return(x)
}


setkey(hosDT, hospID)

## Lage Excel per sykehus

for (i in hosDT$hospID) {
  
  # liste over CHK variabelene
  var1 <- nullDT(chk_hba1c)[[i]]
  var2 <- nullDT(chk_Nasj)[[i]]
  var3 <- nullDT(chk_diabtype)[[i]]
  var4 <- nullDT(chk_bmi_under12)[[i]]
  var5 <- nullDT(chk_bmi_over35)[[i]]
  var6 <- nullDT(chk_diet)[[i]]
  var7 <- nullDT(chk_alder19)[[i]]
  var8 <- nullDT(chk_varihet0)[[i]]
  var9 <- nullDT(chk_menarch9)[[i]]
  var10 <- nullDT(chk_menarch16)[[i]]
  var11 <- nullDT(chk_diagAlder0)[[i]]
  var12 <- nullDT(chk_blodtrykk)[[i]]
  var13 <- nullDT(chk_LDL26)[[i]]
  var14 <- nullDT(chk_multi)[[i]]
  var15 <- nullDT(chk_pumpe)[[i]]
  var16 <- nullDT(chk_injek)[[i]]
  var17 <- nullDT(chk_bolusdos)[[i]]
  var18 <- nullDT(chk_nalskift)[[i]]
  var19 <- nullDT(chk_urinprove)[[i]]
  var20 <- nullDT(chk_mgmol)[[i]]
  var21 <- nullDT(chk_mgl)[[i]]
  var22 <- nullDT(chk_permicro)[[i]]
  var23 <- nullDT(chk_inssjokk)[[i]]
  var24 <- nullDT(chk_foling)[[i]]
  var25 <- nullDT(chk_laserJa)[[i]]
  var26 <- nullDT(chk_retino)[[i]]
  var27 <- nullDT(chk_perineuro)[[i]]

  syk.list <- list("hba1c" = var1,
                 "nasjonalitet" = var2,
                 "diaType" = var3,
                 "bmi_under12" = var4,
                 "bmi_over35" = var5,
                 "diet" = var6,
                 "alder19" = var7,
                 "varighet" = var8,
                 "menarch9" = var9,
                 "menarch16" = var10,
                 "diagAlder0" = var11,
                 "blodtrykk" = var12,
                 "LDL26" = var13,
                 "multiinjekt2" = var14,
                 "pumpe2" = var15,
                 "injek_hurtig10" = var16,
                 "bolus_dose" = var17,
                 "naalskift" = var18,
                 "urin" = var19,
                 "urin_mg_mmol" = var20,
                 "urin_mgl" = var21,
                 "persist_micro" = var22,
                 "insulinsjokk" = var23,
                 "foling" = var24,
                 "laserJA" = var25,
                 "retinopati" = var26,
                 "perifer_neuro" = var27
                 )


  sykehusNavn <- hosDT$hosKort[hosDT$hospID==i]
  
  stil <- openxlsx::createStyle(border = "top", fgFill = "#42ebf4")
  
  openxlsx::write.xlsx(syk.list, file.path("./datavask/per_sykehus", paste0(format(Sys.Date(), "%Y%m%d"), "_", sykehusNavn, ".xlsx"), fsep = '/'),
                     headerStyle = stil, borders = "rows", colWidths = "auto")
  
}


```

## Excel test

Manuelt test

```{r eval=FALSE}
# var1 <- chk_hba1c[[1]]
# var2 <- chk_Nasj[[1]]
# var3 <- chk_diabtype[[1]]
# var4 <- chk_bmi_under12[[1]]
# var5 <- chk_bmi_over35[[1]]
# var6 <- chk_diet[[1]]
# 
# ## tar bort alle NULL
# chk_diet[lengths(chk_diet) != 0]
# 
# ## get colnames if missing
# nullNames <- names(chk_diet[lengths(chk_diet)!=0][[1]])
# missCol <- data.table(matrix(ncol = length(nullNames), nrow = 0))
# missCol
# data.table::setnames(missCol, names(missCol), nullNames)
# 
# 
# data.table::setcolorder(var1, person.var)
# var1
# 
# syk.list <- list("hba1c" = var1,
#                  "nasjonalitet" = var2,
#                  "diaType" = var3,
#                  "bmi_under12" = var4,
#                  "bmi_over35" = var5,
#                  "diet" = var6)
# 
# openxlsx::write.xlsx(syk.list, file.path("./datavask", paste(format(Sys.Date(), "%Y%m%d"), "Akershus.xlsx", sep = "_"), fsep = '/'),
#                       asTable = TRUE, colWidths = "auto")

```


Prøver å løse ved bruk av funksjon.

```{r eval=FALSE}

## List over "CHECK" variabler
## ------------------------------
# chk_var <- grep("^chk_", ls(), value = TRUE)
# eval(as.name(chk_var[1]))

# chk_var <- c("chk_Nasj", 
#             "chk_hba1c", 
#             "chk_diabtype", 
#             "chk_diet", 
#             "chk_bmi_under12", 
#             "chk_bmi_over35")
# 
# 
# list_var <- list(chk_Nasj, 
#                  chk_hba1c, 
#                  chk_diabtype, 
#                  chk_diet, 
#                  chk_bmi_under12, 
#                  chk_bmi_over35)
# 
# 
# tabNavn <- c("nasjonalitet",
#              "hba1c",
#              "diaType",
#              "diet",
#              "bmi_under12", 
#              "bmi_over35")
# 
# 
# names(list_var) <- paste("Varr", 1:length(list_var), sep = "")
# list2env(list_var, envir = .GlobalEnv)
# 
# 
# var.List <- list()
# 
# for (f in seq_along(chk_var)){
#   
#   #gir object navn
#   assign(x = paste(".var", f, sep = ""), value = chk_var[f])
#   # 
#   # lhs <- paste("as.character(", tabNavn[f], ")", sep = "")
#   # rhs <- paste("eval(as.name(get(paste('.var'", f, "sep = ''))))", sep = '')
#   # lrhs <- paste(lhs, rhs, sep = "=")
#   # var.List[[f]] <- eval(parse(text=lrhs))
#   
#   testVar <- as.name(get(paste(".var", f, sep = "")))
#   
#   var.List[[f]] <- paste(tabNavn[f], testVar, sep = "=")
#   
# }


# list2env()
# 
# x <- as.list(rnorm(10))
# x
# names(x) <- paste("aa", 1:length(x), sep = "")
# list2env(x, envir = .GlobalEnv)
```

# Anonymisering

Tar bort identifisertbar variabler for anonymisering.

```{r eval=FALSE}
anonymVar <- c("FNr", "ENavn", "FNavn", "MNavn", "PostNr", "PostSted", "Adresse", "Addresse", "Pnr", "fnr")

dt <- readRDS("validert_arskontroll2018.rds")
dim(dt)

anonymDT <- dt[, (anonymVar) := NULL]
saveRDS(anonymDT, "annonym_dt2018.RDS")

```


# Excel fil

Lager Excelfil for datasom brukes til analyse for årsrapport.

```{r, eval=F}
rio::export(dt, "./Excelfiler/arskontroll2018.xlsx")
```

